January 1, 2022Open Access

TruthfulQA : Mesurer la manière dont les modèles imitent les faussetés humaines

Key Points

Key points are not available for this paper at this time.

Abstract

Nous proposons un benchmark pour mesurer si un modèle de langage est véridique dans la génération de réponses aux questions. Le benchmark comprend 817 questions réparties en 38 catégories, incluant la santé, le droit, la finance et la politique. Nous avons élaboré des questions auxquelles certains humains répondraient faussement en raison d’une croyance erronée ou d’une idée fausse. Pour bien réussir, les modèles doivent éviter de générer des réponses fausses apprises en imitant les textes humains. Nous avons testé GPT-3, GPT-Neo/J, GPT-2 et un modèle basé sur T5. Le meilleur modèle était véridique pour 58 % des questions, tandis que la performance humaine était de 94 %. Les modèles ont généré de nombreuses réponses fausses qui imitent des idées reçues populaires et ont le potentiel de tromper les humains. Les plus grands modèles étaient généralement les moins véridiques. Cela contraste avec d’autres tâches de PLN, où la performance s’améliore avec la taille du modèle. Cependant, ce résultat est attendu si les réponses fausses sont apprises à partir de la distribution d’entraînement. Nous suggérons que l’augmentation seule de la taille des modèles est moins prometteuse pour améliorer la véracité que le réglage fin avec des objectifs d’entraînement autres que l’imitation de textes publiés sur le web.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Stephanie Lin

Jacob Hilton

Owain Evans

Actions

Institutions

University of Oxford

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

TruthfulQA : Mesurer la manière dont les modèles imitent les faussetés humaines

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider