August 8, 2024Open Access

LLMs Podem Superar Humanos em Debates? Uma Estrutura Dinâmica Multiagente para Debate Competitivo

Key Points

Key points are not available for this paper at this time.

Abstract

O debate competitivo é uma tarefa complexa de argumentação computacional. Grandes Modelos de Linguagem (LLMs) sofrem de alucinações e falta de competitividade neste campo. Para enfrentar esses desafios, introduzimos o Agente para Debate (Agent4Debate), uma estrutura dinâmica multiagente baseada em LLMs projetada para aprimorar suas capacidades em debate competitivo. Inspirando-se no comportamento humano na preparação e execução do debate, Agent4Debate emprega uma arquitetura colaborativa onde quatro agentes especializados, envolvendo Pesquisador, Analista, Escritor e Revisor, interagem e cooperam dinamicamente. Esses agentes atuam durante todo o processo do debate, cobrindo múltiplas etapas desde a pesquisa inicial e formulação de argumentos até a refutação e o resumo. Para avaliar de forma abrangente o desempenho da estrutura, construímos a Competitive Debate Arena, composta por 66 motions de debate cuidadosamente selecionados em chinês. Recrutamos dez debatedores humanos experientes e coletamos registros de 200 debates envolvendo Agent4Debate, modelos de referência e humanos. A avaliação emprega o sistema de pontuação automática Debatrix e revisores humanos profissionais baseados nos rankings estabelecidos Debatrix-Elo e Human-Elo. Resultados experimentais indicam que o avançado Agent4Debate apresenta capacidades comparáveis às humanas. Além disso, estudos de ablação demonstram a eficácia de cada componente na estrutura do agente.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yiqun Zhang

Xiaocui Yang

Feng Shi

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

LLMs Podem Superar Humanos em Debates? Uma Estrutura Dinâmica Multiagente para Debate Competitivo

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider