July 1, 2024Open Access

Dr.ICL: 시연-검색 기반 문맥 내 학습

Key Points

Key points are not available for this paper at this time.

Abstract

문맥 내 학습(ICL)은 대규모 언어 모델(LLM)의 파라미터를 조정하는 대신 몇 번의 시연을 통해 작업을 수행하도록 가르치는 강력한 패러다임으로 부상했습니다. 초기 연구는 주로 모든 테스트 쿼리에 대해 고정되거나 무작위로 선택된 시연 집합을 사용했으나, 최근 연구에서는 사용 가능한 시연 풀에서 입력과 의미적으로 유사한 시연을 검색하는 것이 더 나은 성능을 보인다고 제안합니다. 본 연구는 검색 기반 ICL 접근법의 적용 범위를 여러 차원에서 확장합니다. 검색 기반 ICL의 성공을 지침 미세조정된 LLM과 연쇄 사고(Chain-of-Thought, CoT) 프롬프트에도 확장했습니다. 이전 연구는 GPT-3와 같은 일반 대규모 언어 모델을 활용했으나, 우리는 검색된 시연이 지침 미세조정된 LLM에서도 성능 향상을 가져온다는 것을 발견했습니다. 이는 미세조정 단계에서 노출된 훈련 데이터조차도 테스트 중에 검색과 문맥 내 시연을 통해 효과적으로 활용될 수 있으며, 시연을 전혀 사용하지 않거나 무작위로 선택할 때보다 우수한 결과를 가져온다는 점을 시사합니다. CoT의 경우, 시연이 추론 사슬을 포함할 때 이와 같은 사슬을 기반으로 검색함으로써 성능 향상을 얻을 수 있습니다. 마지막으로, 우리는 기성품 검색기보다 우수한 특정 작업용 시연 검색기를 훈련했습니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Man Luo

Xin Xu

Zhuyun Dai

Journals

Data Intelligence

Actions

Institutions

Arizona State University

Google (United States)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Dr.ICL: 시연-검색 기반 문맥 내 학습

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider