What type of study is this?

This is a Experimental Study study.

October 2, 2025Open Access

Conversations Personnalisées au-delà des LLM : Un Gestionnaire de Dialogue Basé sur le RL

Key Points

Le gestionnaire de dialogue basé sur le RL surpasse une référence LLM de pointe en obtenant de meilleures récompenses, améliorant ainsi l'efficacité du dialogue avec des données limitées.
L'intégration de l'apprentissage par renforcement hiérarchique et du méta-apprentissage conduit à une meilleure adaptabilité et efficacité dans la gestion des interactions utilisateur.
Cette méthode personnalise les réponses aux besoins divers des patients, démontrant son applicabilité pour favoriser le changement de comportement via les entretiens motivationnels.
La capacité du cadre à passer fluidement entre les phases de dialogue marque une avancée significative dans les systèmes de dialogue ouverts.

Abstract

Dans ce travail, nous proposons un cadre novateur qui intègre les grands modèles de langage (LLM) avec un gestionnaire de dialogue basé sur le RL pour un dialogue ouvert avec un objectif spécifique. En exploitant l'apprentissage par renforcement hiérarchique pour modéliser les phases structurées du dialogue et en employant le méta-apprentissage afin d'améliorer l'adaptabilité aux profils utilisateurs divers, notre approche renforce l'adaptabilité et l'efficacité, permettant au système d'apprendre à partir de données limitées, de passer fluidement entre les phases du dialogue et de personnaliser les réponses aux besoins hétérogènes des patients. Nous appliquons notre cadre aux entretiens motivationnels visant à encourager un changement de comportement, et démontrons que le gestionnaire de dialogue proposé surpasse une référence LLM de pointe en termes de récompense, montrant un bénéfice potentiel à conditionner les LLM pour créer des systèmes de dialogue ouverts avec des objectifs spécifiques.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Lucie Galland

Catherine Pélachaud

Florian Pécune

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Conversations Personnalisées au-delà des LLM : Un Gestionnaire de Dialogue Basé sur le RL

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider