Key points are not available for this paper at this time.
Les grands modèles de langage (LLMs) sont à l'avant-garde de la transformation de nombreux domaines à l'échelle mondiale. Cependant, leur inclusivité et leur efficacité restent limitées pour les scripts non latins et les langues à faibles ressources. Cet article aborde le défi impératif d'améliorer la performance multilingue des LLMs sans formation ou ajustement fin étendu. Grâce à une investigation systématique et une évaluation de diverses langues utilisant des ensembles de données populaires de questions-réponses (QA), nous présentons des techniques novatrices qui libèrent le véritable potentiel des LLMs dans un paysage polyglotte. Notre approche englobe trois stratégies clés qui produisent des améliorations significatives de la compétence multilingue. Premièrement, en optimisant minutieusement les prompts adaptés aux LLMs polyglottes, nous dévoilons leurs capacités latentes, entraînant des gains de performance substantiels à travers les langues. Deuxièmement, nous introduisons une nouvelle approche hybride qui synergie le LLM Retrieval Augmented Generation (RAG) avec des embeddings multilingues et atteint une meilleure performance pour les tâches multilingues. Enfin, nous proposons une nouvelle méthode d'apprentissage qui sélectionne dynamiquement la stratégie de prompt optimale, le modèle LLM et le modèle d'embedding par requête à l'exécution. Cette adaptation dynamique maximise l'efficacité des LLMs à travers les langues, surpassant les meilleures stratégies statiques et aléatoires. De plus, notre approche adapte les configurations en environnements hors ligne et en ligne, et peut s'adapter sans difficulté à de nouvelles langues et ensembles de données, conduisant à d'importants progrès dans la compréhension et la génération multilingue à travers des langues diverses.
Building similarity graph...
Analyzing shared references across papers
Loading...
Somnath Kumar
Vaibhav Balloli
Mercy Ranjit
Building similarity graph...
Analyzing shared references across papers
Loading...
Kumar et al. (Tue,) ont étudié cette question.
www.synapsesocial.com/papers/68e68232b6db64358760b8f1 — DOI: https://doi.org/10.48550/arxiv.2405.18359