Key points are not available for this paper at this time.
O debate competitivo é uma tarefa complexa de argumentação computacional. Grandes Modelos de Linguagem (LLMs) sofrem de alucinações e falta de competitividade neste campo. Para enfrentar esses desafios, introduzimos o Agente para Debate (Agent4Debate), uma estrutura dinâmica multiagente baseada em LLMs projetada para aprimorar suas capacidades em debate competitivo. Inspirando-se no comportamento humano na preparação e execução do debate, Agent4Debate emprega uma arquitetura colaborativa onde quatro agentes especializados, envolvendo Pesquisador, Analista, Escritor e Revisor, interagem e cooperam dinamicamente. Esses agentes atuam durante todo o processo do debate, cobrindo múltiplas etapas desde a pesquisa inicial e formulação de argumentos até a refutação e o resumo. Para avaliar de forma abrangente o desempenho da estrutura, construímos a Competitive Debate Arena, composta por 66 motions de debate cuidadosamente selecionados em chinês. Recrutamos dez debatedores humanos experientes e coletamos registros de 200 debates envolvendo Agent4Debate, modelos de referência e humanos. A avaliação emprega o sistema de pontuação automática Debatrix e revisores humanos profissionais baseados nos rankings estabelecidos Debatrix-Elo e Human-Elo. Resultados experimentais indicam que o avançado Agent4Debate apresenta capacidades comparáveis às humanas. Além disso, estudos de ablação demonstram a eficácia de cada componente na estrutura do agente.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yiqun Zhang
Xiaocui Yang
Feng Shi
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhang et al. (Qui,) estudaram essa questão.
www.synapsesocial.com/papers/68e5d23bb6db643587567e57 — DOI: https://doi.org/10.48550/arxiv.2408.04472
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: