I about me

[AI 에이전트 엔지니어링] Ch7. 에이전틱 시스템의 학습 본문

AI

[AI 에이전트 엔지니어링] Ch7. 에이전틱 시스템의 학습

ssungni 2026. 5. 30. 16:24

학습 방식의 스펙트럼

1. 비모수적 학습

: 빠르고, 단순, 환경 적응↑ ⇒ finetuning x

 

주요기법

(1) 예시 학습 (Exemplar Learning)

  • few shot prompt
  • 입력 → 메모리 (+ 예시 1, 예시 2, ...)  → 출력  → 피드백(+ 80점, 90점, 70점)

 

(2) 리플렉시온 (Reflexion): 자기 비판

  • 결과 ↗ 성공 메모리 → 성찰 프롬프트 → 성찰 생성 → 메모리 업데이트 → 성찰 주입
            ↘ 실패

(3) 경험 학습 (ExpeL): 작업 간 학습

  • ADD, EDIT, REMOVE, AGREE

 

2. 모수적 학습

: 깊은 특수화, 충분한 자원 필요 finetuning o

 

주요기법

(1) SFT - 지도 파인튜닝

(2) DPO - 직접 선호 최적화
    ·  선호 응답과 비선호 응답 쌍

(3) RLVR - 검증 가능 보상 강화 학습