May 28, 2024Open Access

Combler le fossé : stratégies d'apprentissage dynamiques pour améliorer la performance multilingue des LLMs

Key Points

Key points are not available for this paper at this time.

Abstract

Les grands modèles de langage (LLMs) sont à l'avant-garde de la transformation de nombreux domaines à l'échelle mondiale. Cependant, leur inclusivité et leur efficacité restent limitées pour les scripts non latins et les langues à faibles ressources. Cet article aborde le défi impératif d'améliorer la performance multilingue des LLMs sans formation ou ajustement fin étendu. Grâce à une investigation systématique et une évaluation de diverses langues utilisant des ensembles de données populaires de questions-réponses (QA), nous présentons des techniques novatrices qui libèrent le véritable potentiel des LLMs dans un paysage polyglotte. Notre approche englobe trois stratégies clés qui produisent des améliorations significatives de la compétence multilingue. Premièrement, en optimisant minutieusement les prompts adaptés aux LLMs polyglottes, nous dévoilons leurs capacités latentes, entraînant des gains de performance substantiels à travers les langues. Deuxièmement, nous introduisons une nouvelle approche hybride qui synergie le LLM Retrieval Augmented Generation (RAG) avec des embeddings multilingues et atteint une meilleure performance pour les tâches multilingues. Enfin, nous proposons une nouvelle méthode d'apprentissage qui sélectionne dynamiquement la stratégie de prompt optimale, le modèle LLM et le modèle d'embedding par requête à l'exécution. Cette adaptation dynamique maximise l'efficacité des LLMs à travers les langues, surpassant les meilleures stratégies statiques et aléatoires. De plus, notre approche adapte les configurations en environnements hors ligne et en ligne, et peut s'adapter sans difficulté à de nouvelles langues et ensembles de données, conduisant à d'importants progrès dans la compréhension et la génération multilingue à travers des langues diverses.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Somnath Kumar

Vaibhav Balloli

Mercy Ranjit

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Combler le fossé : stratégies d'apprentissage dynamiques pour améliorer la performance multilingue des LLMs

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study