June 6, 2024Open Access

AgentGym: Agentes basados en grandes modelos de lenguaje que evolucionan a través de diversos entornos

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Construir agentes generalistas que puedan manejar tareas diversas y evolucionar por sí mismos a través de diferentes entornos es un objetivo a largo plazo en la comunidad de IA. Los grandes modelos de lenguaje (LLMs) son considerados una base prometedora para construir tales agentes debido a sus capacidades generalizadas. Los enfoques actuales hacen que los agentes basados en LLM imiten trayectorias proporcionadas por expertos paso a paso, requiriendo supervisión humana, lo cual es difícil de escalar y limita la exploración ambiental; o permiten que los agentes exploren y aprendan en entornos aislados, resultando en agentes especialistas con generalización limitada. En este artículo, damos el primer paso hacia la construcción de agentes basados en LLM generalmente capaces con habilidad de autoevolución. Identificamos una trinidad de ingredientes: 1) entornos diversos para exploración y aprendizaje del agente, 2) un conjunto de trayectorias para dotar a los agentes con capacidades básicas y conocimiento previo, y 3) un método de evolución efectivo y escalable. Proponemos AgentGym, un nuevo marco que presenta una variedad de entornos y tareas para una exploración amplia, en tiempo real, uni-formato y concurrente del agente. AgentGym también incluye una base de datos con instrucciones ampliadas, un conjunto de referencia y trayectorias de alta calidad a través de los entornos. A continuación, proponemos un método novedoso, AgentEvol, para investigar el potencial de la autoevolución del agente más allá de datos previamente vistos en diferentes tareas y entornos. Los resultados experimentales muestran que los agentes evolucionados pueden lograr resultados comparables a modelos SOTA. Publicamos la suite AgentGym, que incluye la plataforma, conjunto de datos, benchmark, puntos de control e implementaciones de algoritmos. La suite AgentGym está disponible en https://github.com/WooooDyy/AgentGym.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zhiheng Xi

Yiwen Ding

Wen-Xiang Chen

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

AgentGym: Agentes basados en grandes modelos de lenguaje que evolucionan a través de diversos entornos

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider