Key points are not available for this paper at this time.
대형 언어 모델(LLM)을 핵심으로 하는 실체화된 에이전트 시스템 구축은 유망한 방향입니다. 현실 세계에서 이러한 에이전트를 배포하고 훈련하는 데 상당한 비용과 통제할 수 없는 요인이 있기 때문에, 우리는 마인크래프트 환경에서 탐색을 시작하기로 결정했습니다. 우리의 STEVE 시리즈 에이전트는 가상 환경에서 기본 작업은 물론, 내비게이션과 심지어 창의적인 작업과 같은 더 도전적인 작업도 수행할 수 있으며, 이전의 최첨단 방법을 2.5~7.3배 능가하는 효율성을 보입니다. 우리는 바닐라 대형 언어 모델에서 탐색을 시작하여, 여기에 비전 인코더와 수집한 고품질 데이터셋 STEVE-21K로 학습된 액션 코드베이스를 추가했습니다. 이후, 우리는 이를 비평자(Critic)와 메모리로 강화하여 복잡한 시스템으로 전환했습니다. 마지막으로, 계층적 다중 에이전트 시스템을 구축했습니다. 최근 연구에서는 지식 증류를 통해 에이전트 시스템을 가지치기(prune)하는 방법을 탐구했습니다. 앞으로는 STEVE 에이전트의 현실 세계에서의 더 많은 잠재적 응용을 탐색할 계획입니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhonghan Zhao
Wenhao Chai
Wang Xuan
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhao 등(월요일)은 이 문제를 연구했습니다.
www.synapsesocial.com/papers/68e64779b6db6435875d8ffd — DOI: https://doi.org/10.48550/arxiv.2406.11247