June 6, 2024Open Access

AgentGym：在多样环境中进化的大型语言模型代理

Key Points

Key points are not available for this paper at this time.

Abstract

构建能够处理多样任务并能在不同环境中自我进化的通用代理，是人工智能社区的长期目标。大型语言模型（LLM）因其广泛的能力被视为构建此类代理的有前景基础。目前的方法要么使基于LLM的代理逐步模仿专家提供的轨迹，需人工监督，难以扩展且限制了环境探索；要么让代理在孤立环境中探索学习，导致具有限定泛化能力的专门代理。本文迈出构建具备自我进化能力的通用LLM代理的第一步。我们识别出三大关键要素：1）多样环境支持代理的探索学习；2）轨迹集为代理提供基本能力和先验知识；3）有效且可扩展的进化方法。我们提出AgentGym新框架，包含多样环境和任务，支持广泛、实时、统一格式及并发的代理探索。AgentGym还包括扩展指令数据库、基准套件和跨环境的高质量轨迹。随后，我们提出新方法AgentEvol，探讨代理超越已见数据的跨任务跨环境自我进化潜力。实验证明，进化后的代理取得了可与先进模型媲美的结果。我们发布AgentGym套件，含平台、数据集、基准、检查点及算法实现。AgentGym套件可于https://github.com/WooooDyy/AgentGym获取。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zhiheng Xi

Yiwen Ding

Wen-Xiang Chen

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

AgentGym：在多样环境中进化的大型语言模型代理

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider