May 23, 2024Open Access

Rumo a um Grounding Eficiente de LLM para Colaboração Embodiment de Multiagentes

Key Points

Key points are not available for this paper at this time.

Abstract

Localizar a capacidade de raciocínio de grandes modelos de linguagem (LLMs) para tarefas incorporadas é desafiador devido à complexidade do mundo físico. Especialmente, o planejamento de LLM para colaboração de multiagentes requer comunicação entre os agentes ou atribuição de crédito como feedback para reajustar os planos propostos e alcançar uma coordenação eficaz. No entanto, os métodos existentes que dependem excessivamente da verificação física ou autorreflexão sofrem de consultas excessivas e ineficientes aos LLMs. Neste artigo, propomos uma nova estrutura para colaboração de multiagentes que introduz o feedback de Vantagem Reforçada (ReAd) para auto-refinamento eficiente dos planos. Especificamente, realizamos regressão crítica para aprender uma função sequencial de vantagem a partir de dados de planejamento do LLM, e então tratamos o planejador LLM como um otimizador para gerar ações que maximizem a função de vantagem. Isso dota o LLM de previsão para discernir se a ação contribui para a realização da tarefa final. Fornecemos análise teórica ao estender a regressão ponderada por vantagem em aprendizado por reforço para sistemas multiagentes. Experimentos no Overcooked-AI e uma variante difícil do RoCoBench mostram que o ReAd supera os baselines na taxa de sucesso, e também diminui significativamente os passos de interação dos agentes e as rodadas de consulta dos LLMs, demonstrando sua alta eficiência para o grounding de LLMs. Mais resultados estão disponíveis em https: //read-llm. github. io/.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yang Zhang

Shixin Yang

Chenjia Bai

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Rumo a um Grounding Eficiente de LLM para Colaboração Embodiment de Multiagentes

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider