Key points are not available for this paper at this time.
O rápido progresso em machine learning (ML) trouxe muitos grandes modelos de linguagem (LLMs) que se destacam em várias tarefas e áreas. Esses LLMs possuem diferentes habilidades e custos em termos de computação ou preço. Como a demanda por cada consulta pode variar, por exemplo, devido ao domínio consultado ou sua complexidade, optar por um único LLM em uma aplicação geralmente não é a melhor escolha, seja ele o maior, o mais caro ou mesmo aquele com melhor desempenho médio em testes. Consequentemente, escolher o LLM certo que seja ao mesmo tempo preciso e custo-efetivo para uma aplicação continua sendo um desafio. Neste artigo, apresentamos o MetaLLM, uma estrutura que direciona dinamicamente e de forma inteligente cada consulta para o LLM ideal (entre vários LLMs disponíveis) para tarefas de classificação, alcançando melhoria significativa na precisão e custo-efetividade. Ao enquadrar o problema da seleção como um bandido multi-braço, o MetaLLM equilibra precisão preditiva e eficiência de custo sob incerteza. Nossos experimentos, conduzidos em plataformas populares de LLMs como os modelos GPT da OpenAI, Titan da Amazon, Claude da Anthropic e LLaMa da Meta, demonstram a eficácia do MetaLLM em cenários do mundo real, estabelecendo a base para futuras extensões além de tarefas de classificação.
Building similarity graph...
Analyzing shared references across papers
Loading...
Quang H. Nguyen
Duy C. Hoang
Juliette Decugis
Building similarity graph...
Analyzing shared references across papers
Loading...
Nguyen et al. (Mon,) estudaram essa questão.
www.synapsesocial.com/papers/68e6046bb6db643587597b52 — DOI: https://doi.org/10.48550/arxiv.2407.10834
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: