Los puntos clave no están disponibles para este artículo en este momento.
Construir agentes generalistas que puedan manejar tareas diversas y evolucionar por sí mismos a través de diferentes entornos es un objetivo a largo plazo en la comunidad de IA. Los grandes modelos de lenguaje (LLMs) son considerados una base prometedora para construir tales agentes debido a sus capacidades generalizadas. Los enfoques actuales hacen que los agentes basados en LLM imiten trayectorias proporcionadas por expertos paso a paso, requiriendo supervisión humana, lo cual es difícil de escalar y limita la exploración ambiental; o permiten que los agentes exploren y aprendan en entornos aislados, resultando en agentes especialistas con generalización limitada. En este artículo, damos el primer paso hacia la construcción de agentes basados en LLM generalmente capaces con habilidad de autoevolución. Identificamos una trinidad de ingredientes: 1) entornos diversos para exploración y aprendizaje del agente, 2) un conjunto de trayectorias para dotar a los agentes con capacidades básicas y conocimiento previo, y 3) un método de evolución efectivo y escalable. Proponemos AgentGym, un nuevo marco que presenta una variedad de entornos y tareas para una exploración amplia, en tiempo real, uni-formato y concurrente del agente. AgentGym también incluye una base de datos con instrucciones ampliadas, un conjunto de referencia y trayectorias de alta calidad a través de los entornos. A continuación, proponemos un método novedoso, AgentEvol, para investigar el potencial de la autoevolución del agente más allá de datos previamente vistos en diferentes tareas y entornos. Los resultados experimentales muestran que los agentes evolucionados pueden lograr resultados comparables a modelos SOTA. Publicamos la suite AgentGym, que incluye la plataforma, conjunto de datos, benchmark, puntos de control e implementaciones de algoritmos. La suite AgentGym está disponible en https://github.com/WooooDyy/AgentGym.
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhiheng Xi
Yiwen Ding
Wen-Xiang Chen
Building similarity graph...
Analyzing shared references across papers
Loading...
Xi et al. (Thu,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e65d1eb6db6435875ebad8 — DOI: https://doi.org/10.48550/arxiv.2406.04151
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: