728x90
파인튜닝 훈련을 위한 데이터 준비
LLM의 언어 이해 능력을 특정 분야의 작업에 더 잘맞게 조정하는 파인튜닝을 통해 관련성이 높고 정확한 답변을 효율적으로 생성하기 위함
[훈련셋]을 통해 데이터의 패턴과 관계를 학습하고 인식, [검증셋]을 통해 모델의 성능을 평가, [테스트셋]을 통해 모델의 능력이 새로운 데이터를 접해도 편향되어 있지 않은지 최종 평가
[손실 함수]를 통해 모델 예측 값과 실제 목표 값 사이 차이를 정량화해 오차를 계산하고 이를 최소화해 더 나은 예측을 달성하는 지표 역할
파인튜닝 모델 훈련 전략
목표를 위한 훈련, 검증, 테스트 데이터셋 수집 > 하이퍼파라미터 설정(모델 가중치 결정 + 단일 업데이트 훈련셋 사이즈 결정 + 훈련셋 반복 학습 수 설정)을 통한 과적합, 과소적합 문제 방지 > 모델 아키텍처 수정을 통한 목표 작업 적응 > 검증셋을 이용해 평가 (성능 지표 이용) > 피드백을 얻을 수 있도록 기존 실제 환경에 통합 및 모니터링
ex) 리뷰 제목과 리뷰 본문을 결합, 새로운 완성 영을 생성하여 영어 리뷰만 포함하도록 필터링,
파인튜닝 모델 어플리케이션 통합
파인튜닝 모델의 식별자를 OPEN API를 사용하여 교체 > 프롬프트 구조나 출력 형식의 로직 업데이트 > 성능 모니터링 및 사용자 피드백 수집을 통한 평가
'Book' 카테고리의 다른 글
쉽고 빠르게 익히는 실전 LLM - CHAPTER 6. 임베딩과 모델 아키텍처 맞춤화 (0) | 2024.04.21 |
---|---|
쉽고 빠르게 익히는 실전 LLM - CHAPTER 5. 고급 프롬프트 엔지니어링 (0) | 2024.04.19 |
쉽고 빠르게 익히는 실전 LLM - CHAPTER 3. 프롬프트 엔지니어링의 첫 번째 단계 (0) | 2024.04.18 |
쉽고 빠르게 익히는 실전 LLM - CHAPTER 2. LLM을 이용한 의미 기반 검색 (0) | 2024.04.18 |
쉽고 빠르게 익히는 실전 LLM - CHAPTER 1. LLM이란 (1) | 2024.04.17 |