물 안들어와도 노 젓는다.

  • 홈
  • 태그
  • 방명록

llama.cpp 1

대규모 언어 모델(LLM) 양자화해보기

오늘은 거대한 언어 모델을 나의 PC(CPU든 GPU든!)에서 효율적으로 돌리고 싶을 때 반드시 알아야 할 기술, 바로 '양자화(Quantization)'를 직접 해보았다. GGUF: LLM의 새로운 표준 컨테이너GGUF는 llama.cpp 프로젝트에서 개발한 LLM을 위한 새로운 파일 형식이다. 이 형식은 CPU, NVIDIA GPU, AMD GPU 등 다양한 하드웨어에서 LLM을 효율적으로 로드하고 실행할 수 있도록 설계된 범용적인 컨테이너 형식이다. GGUF는 양자화된 가중치를 담는 데 최적화되어 있다. GGUF는 llama.cpp 생태계의 전용 형식이면서 마치 .exe 파일이 윈도우 운영체제에서 실행되는 것처럼, GGUF 파일은 llama.cpp (또는 GGUF를 지원하는 다른 특수 클라이언트)에..

인공지능/직접 해보기 2025.06.27
이전
1
다음
더보기
프로필사진

물 안들어와도 노 젓는다.

개발자로서 쌓아온 경험을 기반으로 이제는 AI 기술을 접목해 제품 기획, 개발, 조직 운영까지 역량을 확장하고자 합니다. 그 모든 과정을 이 블로그에 기록하고 있습니다. 함께 배우고 성장해요!

  • 분류 전체보기 (92)
    • 인공지능 (47)
      • 직접 해보기 (6)
    • 리서치 (1)
    • PM (17)
      • 직접 해보기 (5)
    • 세미나 (3)
    • 수료기 (7)

Tag

RNN, KPI, 양자화, finetuning, 사용자 리서치, 스크럼, 서비스 정책서, rag, CNN, 파인 튜닝, 상세 기능 명세서, 트랜스 포머, Stable diffusion, PM, 파인튜닝, 프롬프트 엔지니어, OKR, LLM, google pm certificate, 개발자에서 pm,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/04   »
일 월 화 수 목 금 토
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

  • 포트폴리오

티스토리툴바