May 17, 2024Open Access

Les grands modèles de langage sont-ils des hypocrites moraux ? Une étude basée sur les fondations morales

Key Points

Key points are not available for this paper at this time.

Abstract

Les grands modèles de langage (LLMs) ont pris une place centrale dans les débats sur l'intelligence artificielle. Pourtant, il existe encore un vide quant à la manière d'évaluer la conformité des LLMs aux valeurs humaines importantes. Dans cet article, nous étudions si les LLMs à la pointe de la technologie, GPT-4 et Claude 2.1 (Gemini Pro et LLAMA 2 n'ont pas généré de résultats valides), sont des hypocrites moraux. Nous utilisons deux instruments de recherche basés sur la théorie des fondations morales : (i) le questionnaire des fondations morales (MFQ), qui étudie quelles valeurs sont considérées comme moralement pertinentes dans des jugements moraux abstraits ; et (ii) les vignettes des fondations morales (MFVs), qui évaluent la cognition morale dans des scénarios concrets liés à chaque fondation morale. Nous caractérisons les conflits de valeurs entre ces différentes abstractions de l'évaluation morale comme de l'hypocrisie. Nous avons constaté que les deux modèles ont affiché une cohérence raisonnable au sein de chaque instrument comparativement aux humains, mais qu'ils ont manifesté un comportement contradictoire et hypocrite lorsque nous avons comparé les valeurs abstraites présentes dans le MFQ à l'évaluation des violations morales concrètes du MFV.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

José Luiz Nunes

Guilherme Almeida

Marcelo de Araújo

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Les grands modèles de langage sont-ils des hypocrites moraux ? Une étude basée sur les fondations morales

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider