Los puntos clave no están disponibles para este artículo en este momento.
Trabajos recientes han demostrado cómo las capacidades de razonamiento de los Grandes Modelos de Lenguaje (LLMs) pueden aplicarse a dominios más allá del procesamiento de lenguaje natural, como la planificación y la interacción para robots. Estos problemas corporalizados requieren que un agente entienda muchos aspectos semánticos del mundo: el repertorio de habilidades disponibles, cómo estas habilidades influyen en el mundo y cómo los cambios en el mundo se reflejan de nuevo en el lenguaje. La planificación con LLMs en entornos corporalizados necesita considerar no solo qué habilidades realizar, sino también cómo y cuándo hacerlas, respuestas que cambian con el tiempo en función de las propias elecciones del agente. En este trabajo, investigamos hasta qué punto los LLMs usados en tales contextos corporalizados pueden razonar sobre fuentes de retroalimentación proporcionadas mediante lenguaje natural, sin ningún entrenamiento adicional. Proponemos que, al aprovechar la retroalimentación del entorno, los LLMs son capaces de formar un monólogo interno que les permite procesar y planificar de manera más rica en escenarios de control robótico. Investigamos diversas fuentes de retroalimentación, como detección de éxito, descripción de la escena e interacción humana. Encontramos que la retroalimentación lingüística en bucle cerrado mejora significativamente la realización de instrucciones de alto nivel en tres dominios, incluyendo tareas simuladas y reales de reordenamiento de mesa y tareas de manipulación móvil de largo horizonte en un entorno de cocina en el mundo real.
Building similarity graph...
Analyzing shared references across papers
Loading...
Wenlong Huang
Fei Xia
Ted Xiao
Building similarity graph...
Analyzing shared references across papers
Loading...
Huang et al. (mar,) estudiaron esta cuestión.
www.synapsesocial.com/papers/6a08052edf3db87398107421 — DOI: https://doi.org/10.48550/arxiv.2207.05608