What type of study is this?

This is a Quantitative Study study.

October 20, 2025Open Access

Vers une Recherche Approfondie Personnalisée : Référentiels et Évaluations

Key Points

Le Personalized Deep Research Bench cible l'évaluation des agents de recherche approfondie en introduisant des profils utilisateur réalistes.
Le Cadre d'Évaluation PQR évalue la performance des systèmes en se concentrant sur l'alignement de la personnalisation, la qualité du contenu et la fiabilité factuelle.
Les expériences menées sur divers systèmes révèlent des limites dans le traitement des requêtes personnalisées tout en indiquant les capacités existantes.
Ce travail pose les bases pour le développement et l'évaluation des futurs assistants de recherche IA personnalisés.

Abstract

Les Agents de Recherche Approfondie (ARA) peuvent mener de manière autonome des enquêtes complexes et générer des rapports complets, démontrant un fort potentiel réel. Cependant, les évaluations existantes reposent principalement sur des référentiels à questions fermées, tandis que les référentiels de recherche approfondie ouverts restent rares et négligent généralement les scénarios personnalisés. Pour combler cette lacune, nous présentons Personalized Deep Research Bench, le premier référentiel pour évaluer la personnalisation chez les ARA. Il associe 50 tâches de recherche diversifiées dans 10 domaines à 25 profils utilisateur authentiques combinant des attributs de persona structurés avec des contextes dynamiques du monde réel, produisant 250 requêtes utilisateur-tâche réalistes. Pour évaluer la performance des systèmes, nous proposons le Cadre d'Évaluation PQR, qui mesure conjointement (P) l'Alignement de la Personnalisation, (Q) la Qualité du Contenu et (R) la Fiabilité Factuelle. Nos expériences sur une gamme de systèmes mettent en lumière les capacités actuelles et les limites dans la gestion de la recherche approfondie personnalisée. Ce travail établit une base rigoureuse pour le développement et l'évaluation de la prochaine génération d'assistants de recherche IA véritablement personnalisés.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yuan Liang

J.X. Li

Yuqing Wang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Vers une Recherche Approfondie Personnalisée : Référentiels et Évaluations

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider