Key points are not available for this paper at this time.
이 연구는 대형 언어 모델(LLMs)을 계획 수립자로 사용하여 자연어 지시를 따라 복잡한 작업을 시각적으로 인지된 환경에서 수행할 수 있는 구현 에이전트를 만드는 것에 중점을 둡니다. 기존 방법들의 높은 데이터 비용과 낮은 샘플 효율성은 다수의 작업을 수행할 수 있으며 새로운 작업을 빠르게 학습할 수 있는 다재다능한 에이전트 개발을 저해합니다. 본 연구에서는 대형 언어 모델의 능력을 활용해 구현 에이전트를 위한 소수 샷 계획 수립을 가능하게 하는 새로운 방법 LLM-Planner를 제안합니다. 또한 환경에 기반한 계획을 생성 및 갱신하도록 LLM을 물리적 근거와 결합하는 간단하지만 효과적인 방법을 제시합니다. ALFRED 데이터셋 실험 결과, 본 방법은 매우 경쟁력 있는 소수 샷 성능을 달성합니다: 전체 훈련 데이터의 0.5% 미만만 사용했음에도 불구하고, LLM-Planner는 전체 훈련 데이터를 사용해 학습된 최신 기준들과 경쟁력 있는 성능을 보였습니다. 동일한 소수 샷 설정에서는 기존 방법들은 거의 어떤 작업도 성공적으로 완료하지 못합니다. 본 연구는 다수 작업을 빠르게 학습할 수 있고 샘플 효율성이 높은 다재다능한 구현 에이전트 개발의 길을 열었습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Chan Hee Song
Brian M. Sadler
Jiaman Wu
The Ohio State University
DevCom (Czechia)
Building similarity graph...
Analyzing shared references across papers
Loading...
Song 등(Sun,)이 이 질문을 연구했습니다.
www.synapsesocial.com/papers/69deb5cc1d9bba5129b0c9db — DOI: https://doi.org/10.1109/iccv51070.2023.00280