Key points are not available for this paper at this time.
构建能够处理多样任务并能在不同环境中自我进化的通用代理,是人工智能社区的长期目标。大型语言模型(LLM)因其广泛的能力被视为构建此类代理的有前景基础。目前的方法要么使基于LLM的代理逐步模仿专家提供的轨迹,需人工监督,难以扩展且限制了环境探索;要么让代理在孤立环境中探索学习,导致具有限定泛化能力的专门代理。本文迈出构建具备自我进化能力的通用LLM代理的第一步。我们识别出三大关键要素:1)多样环境支持代理的探索学习;2)轨迹集为代理提供基本能力和先验知识;3)有效且可扩展的进化方法。我们提出AgentGym新框架,包含多样环境和任务,支持广泛、实时、统一格式及并发的代理探索。AgentGym还包括扩展指令数据库、基准套件和跨环境的高质量轨迹。随后,我们提出新方法AgentEvol,探讨代理超越已见数据的跨任务跨环境自我进化潜力。实验证明,进化后的代理取得了可与先进模型媲美的结果。我们发布AgentGym套件,含平台、数据集、基准、检查点及算法实现。AgentGym套件可于https://github.com/WooooDyy/AgentGym获取。
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhiheng Xi
Yiwen Ding
Wen-Xiang Chen
Building similarity graph...
Analyzing shared references across papers
Loading...
Xi等人(周四)研究了这一问题。
www.synapsesocial.com/papers/68e65d1eb6db6435875ebad8 — DOI: https://doi.org/10.48550/arxiv.2406.04151
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: