[AI 에이전트 엔지니어링] Ch7. 에이전틱 시스템의 학습

Notice

Recent Posts

Tags more

Archives

관리 메뉴

I about me

ssungni 2026. 5. 30. 16:24

: 빠르고, 단순, 환경 적응↑ ⇒ finetuning x

주요기법

(1) 예시 학습 (Exemplar Learning)

(2) 리플렉시온 (Reflexion): 자기 비판

(3) 경험 학습 (ExpeL): 작업 간 학습

: 깊은 특수화, 충분한 자원 필요 ⇒ finetuning o

주요기법

(1) SFT - 지도 파인튜닝

(2) DPO - 직접 선호 최적화
· 선호 응답과 비선호 응답 쌍

(3) RLVR - 검증 가능 보상 강화 학습

[AI 에이전트 엔지니어링] Ch9. 검증 및 측정 (0)	2026.05.30
[AI 에이전트 엔지니어링] Ch8. 단일 에이전트에서 멀티 에이전트로 (0)	2026.05.30
[AI 에이전트 엔지니어링] Ch6. 지식과 메모리 (0)	2026.05.30
[AI 에이전트 엔지니어링] Ch5. 오케스트레이션 (0)	2026.05.30
[AI 에이전트 엔지니어링] Ch4. 도구 (0)	2026.05.30

'AI' Related Articles