Key points are not available for this paper at this time.
Apesar das capacidades impressionantes dos Large Language Models (LLMs) em várias tarefas, eles ainda enfrentam dificuldades em cenários que envolvem raciocínio complexo e planejamento. Trabalhos recentes propuseram técnicas avançadas de prompting e a necessidade de fine-tuning com dados de alta qualidade para aumentar as habilidades de raciocínio dos LLMs. Contudo, essas abordagens são inerentemente limitadas pela disponibilidade e qualidade dos dados. À luz disso, autocorreção e autoaprendizado emergem como soluções viáveis, empregando estratégias que permitem aos LLMs refinarem suas saídas e aprenderem a partir de recompensas autoavaliadas. Entretanto, a eficácia dos LLMs em auto-refinar suas respostas, especialmente em tarefas complexas de raciocínio e planejamento, permanece duvidosa. Neste artigo, introduzimos AlphaLLM para o autoaperfeiçoamento de LLMs, que integra Monte Carlo Tree Search (MCTS) com LLMs para estabelecer um ciclo de autoaperfeiçoamento, aprimorando assim as capacidades dos LLMs sem anotações adicionais. Inspirando-se no sucesso do AlphaGo, AlphaLLM aborda os desafios únicos de combinar MCTS com LLM para autoaperfeiçoamento, incluindo escassez de dados, a vastidão dos espaços de busca das tarefas linguísticas e a natureza subjetiva do feedback em tarefas linguísticas. AlphaLLM é composto por um componente de síntese de prompts, uma abordagem eficiente de MCTS adaptada para tarefas linguísticas e um trio de modelos críticos para feedback preciso. Nossos resultados experimentais em tarefas de raciocínio matemático demonstram que AlphaLLM melhora significativamente o desempenho dos LLMs sem anotações adicionais, mostrando potencial para autoaperfeiçoamento em LLMs.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ye Tian
Baolin Peng
Linfeng Song
Building similarity graph...
Analyzing shared references across papers
Loading...
Tian et al. (Qui,) estudaram esta questão.
www.synapsesocial.com/papers/68e6e8afb6db643587663c2d — DOI: https://doi.org/10.48550/arxiv.2404.12253
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: