November 8, 2025Open Access

Seleção de Respostas Consciente da Incerteza para Melhor Raciocínio em Sistemas Multi-LLM

Key Points

A abordagem proposta melhora o raciocínio ao aproveitar pontuações de log-verossimilhança de múltiplos LLMs e o conhecimento de suas saídas.
Foram demonstradas melhorias de 4%, 3% e 5% em configurações de debate e não debate, com os principais conjuntos de dados sendo GSM8K, MMLU e ARC.
A avaliação envolveu analisar respostas diversas em interações multi-LLM em vez de modelos LLM únicos, focando em eficiência e precisão.
A seleção aprimorada de respostas pode possibilitar aplicações mais amplas para tarefas complexas de tomada de decisão com LLMs.

Abstract

Grandes Modelos de Linguagem (LLMs) demonstraram capacidades excepcionais, mas selecionar a resposta mais confiável entre múltiplos LLMs continua sendo um desafio, especialmente em ambientes com recursos limitados. Abordagens existentes frequentemente dependem de verificadores externos custosos, avaliadores humanos ou técnicas de autoconsistência que exigem múltiplas amostras de um único modelo. Embora sistemas multi-LLM produzam respostas mais diversas do que modelos únicos e, portanto, tenham maior potencial, muitas vezes apresentam desempenho inferior comparado à autoconsistência de um único LLM. Propomos um método novo, fundamentado e computacionalmente eficiente para selecionar a melhor resposta entre múltiplos LLMs distintos, utilizando uma pontuação calibrada de log-verossimilhança, aproveitando implicitamente o conhecimento e a confiança inerentes desses modelos. Nosso método demonstra melhorias aproximadas de 4%, 3% e 5% tanto em cenários de debate (discussões multi-turno entre LLMs) quanto não-debate (Best-of-N com múltiplos LLMs) nos conjuntos de dados GSM8K, MMLU (6 subconjuntos) e ARC, respectivamente.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Aakriti Agrawal

Rohith Aralikatti

Anirudh Satheesh

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Seleção de Respostas Consciente da Incerteza para Melhor Raciocínio em Sistemas Multi-LLM

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider