Dans ce travail, nous proposons un cadre novateur qui intègre les grands modèles de langage (LLM) avec un gestionnaire de dialogue basé sur le RL pour un dialogue ouvert avec un objectif spécifique. En exploitant l'apprentissage par renforcement hiérarchique pour modéliser les phases structurées du dialogue et en employant le méta-apprentissage afin d'améliorer l'adaptabilité aux profils utilisateurs divers, notre approche renforce l'adaptabilité et l'efficacité, permettant au système d'apprendre à partir de données limitées, de passer fluidement entre les phases du dialogue et de personnaliser les réponses aux besoins hétérogènes des patients. Nous appliquons notre cadre aux entretiens motivationnels visant à encourager un changement de comportement, et démontrons que le gestionnaire de dialogue proposé surpasse une référence LLM de pointe en termes de récompense, montrant un bénéfice potentiel à conditionner les LLM pour créer des systèmes de dialogue ouverts avec des objectifs spécifiques.
Building similarity graph...
Analyzing shared references across papers
Loading...
Lucie Galland
Catherine Pélachaud
Florian Pécune
Building similarity graph...
Analyzing shared references across papers
Loading...
Galland et al. (Tue,) ont étudié cette question.
www.synapsesocial.com/papers/68de84bf5b556a9128e1bf4a — DOI: https://doi.org/10.48550/arxiv.2506.19652
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: