사전 학습된(pre-trained) 모델 종류

인공지능

사전 학습된(pre-trained) 모델 종류

원담 2025. 6. 26. 10:38

728x90

다양한 분야에서 널리 사용되는 여러 사전 학습된 모델이 존재한다. 머신러닝 분야는 매우 빠르게 발전하고 있으므로, 오늘 이후에도 새로운 모델들이 계속 등장할 수 있다. 다음은 현재까지 잘 알려진 대표적인 사전 학습 모델이다.

1. 자연어처리(NLP) 분야

BERT (Bidirectional Encoder Representations from Transformers)
- 구글(Google)에서 개발한 모델
- 감정 분석, 개체명 인식(NER), 질의응답(Q&A) 등의 작업에서 뛰어난 성능
  - NER 활용하여 환자 기록에서 병명, 증상, 처방전 자동 추출 가능
  - 쿼리 문맥을 이해하여 더 정확한 검색 결과 제공 가능
  - 질문의 의미를 정확히 파악해 적절한 응답 제공 가능
- 문맥을 양방향으로 이해한다는 점이 특징
GPT (Generative Pre-trained Transformer)
- OpenAI에서 개발한 시리즈로, 사람처럼 자연스러운 텍스트를 생성하는 데 사용
- 다양한 언어 관련 작업에 유연하게 활용 가능
  - 실시간 질의 응답, 글쓰기, 코드 작성
  - 마케팅 문구 생성, 뉴스 기사 자동 생성
  - AI 작가 도우미
Word2Vec
- 모델이라기보다는 단어 임베딩(embedding) 기법
- 대규모 말뭉치(corpus)에서 단어의 문맥을 기반으로 벡터를 생성
- 이후 다양한 NLP 작업에 사용할 수 있다
  - "왕: 남자 = 여왕 :?" 같은 관계 학습에 활용 가능 (유사도 판단)
  - 이런 관계를 활용하여 상품 이름이 다르지만 유사한 의미를 가진 경우 검색 정확도 향상(이커머스 검색엔진)
FastText
- Facebook에서 개발한 Word2 Vec의 확장판
- 서브워드(subword) 정보를 활용하여 단어 임베딩을 수행
  - 오타가 많아도 subword 기반 분석이 가능해서 안정적인 감정 분류가 가능하다(SNS 활용가능)
  - 이력서의 키워드를 분류하고 직무와 매칭이 가능하다(채용 플랫폼 자동 분류)
- 특히 텍스트 분류나 OOV(out-of-vocabulary) 단어 처리에 강력
  - 기존에 Word2Vec 같은 단어 기반 임베딩은 사전에 없는 단어가 입력되면 무시하거나 오류를 내뱉기 때문에 처리를 못하는 문제가 있었고 subword는 단어보다 더 작은 단위로서 단어를 의미 있는 조각(접두산, 어간 등)으로 나눠서 학습하는 방식이다
  - 예를 들어 Word2 Vec에서 "사과", "바나나"를 학습한 후에 "사과맛우유"는 학습하지 않은 단어라 임베딩을 못하지만 FastText를 사용하면 "사과맛우유" 같은 케이스도 임베딩이 가능해서 더 안정적이게 활용 가능하다
  - 신조어 처리 유연

2. 이미지 처리 분야

ResNet (Residual Network)
- 딥러닝 모델에서 매우 깊은 네트워크 구조를 가능하게 한 잔차 연결(residual connection)로 유명
  - 잔차연결은 신경망 깊이가 싶을수록 학습이 잘 안 되어서 원래의 입력을 계산 결과에 그대로 더해서 출력으로 만드는 구조
- 이미지 분류, 객체 인식, 이미지 세분화 등에 널리 사용
  - 교통 표지판, 차량, 사람 인식
  - 제품 사진에서 결함 탐지
  - 의료 영상 분석
VGG (Visual Geometry Group)
- 구조가 단순하면서도 강력한 이미지 분류 모델
  - 이미지 검색 서비스
  - 옷 사진을 분류해 유사 스타일 추천
  - 강아지 고양이 등 자동 이닛후 태그 부여(사진 자동 태깅)
- 이미지넷(ImageNet) 대회에서 큰 성과
InceptionNet (GoogLeNet)
- 구글에서 개발한 모델로, 계산 자원을 효율적으로 사용하는 구조
- 이미지 분류와 객체 인식에 사용
  - 다양한 해상도의 영상에서 건물, 도로 식별
  - 드론으로 촬영한 작물 이미지에서 병해 감지
  - CCTV 영상에서 사람 수, 교통량 분석
MobileNet
- 모바일 및 에지 디바이스에서 실시간으로 작동할 수 있도록 설계된 경량 모델
- 계산 자원이 부족한 환경에서도 높은 성능을 발휘
  - 모바일 앱 얼굴 인식(안면 인식 잠금 해제, AR 필터)
  - 스마트폰 카메라로 시설물 손상 여부 판단
Xception
- InceptionNet의 확장 모델로, 채널 간 상관관계와 공간적 상관관계를 분리하여 효율적으로 학습
- 이미지 분류에서 뛰어난 성능을 보임
  - 질병 분류
  - 미세한 표정변화, 감정 상태 분류
YOLO (You Only Look Once)
- 실시간 객체 탐지(object detection) 모델
- YOLOv3 등 여러 버전이 있으며, 빠른 속도와 높은 정확도로 다양한 실시간 비전 작업에 사용
  - CCTV 실시간 감시, 무인매장 상품 인식, 도로 위 객체 탐지

728x90

저작자표시 (새창열림)

'인공지능' 카테고리의 다른 글

파인튜닝 사용하기 좋은 케이스 (0)	2025.07.04
양자화 (0)	2025.06.26
Fine-Tuning 소개 (6)	2025.06.24
자연어 처리 시스템: 인간의 언어를 이해하기 (3)	2025.06.20
시계열 예측 시스템: 과거 데이터로 미래를 읽기 (2)	2025.06.19

현재글사전 학습된(pre-trained) 모델 종류

물 안들어와도 노 젓는다.

개발자로서 쌓아온 경험을 기반으로 이제는 AI 기술을 접목해 제품 기획, 개발, 조직 운영까지 역량을 확장하고자 합니다. 그 모든 과정을 이 블로그에 기록하고 있습니다. 함께 배우고 성장해요!

양자화, OKR, 파인 튜닝, 개발자에서 pm, 사용자 리서치, 트랜스 포머, 상세 기능 명세서, 파인튜닝, PM, Stable diffusion, 스크럼, finetuning, rag, RNN, 서비스 정책서, LLM, 프롬프트 엔지니어, KPI, google pm certificate, CNN,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30

물 안들어와도 노 젓는다.

사전 학습된(pre-trained) 모델 종류

1. 자연어처리(NLP) 분야

2. 이미지 처리 분야

'인공지능' 카테고리의 다른 글

'인공지능'의 다른글

티스토리툴바

사전 학습된(pre-trained) 모델 종류

1. 자연어처리(NLP) 분야

2. 이미지 처리 분야

'인공지능' 카테고리의 다른 글

'인공지능'의 다른글

관련글

티스토리툴바