Key points are not available for this paper at this time.
Les grands modèles de langage (LLMs) ont pris une place centrale dans les débats sur l'intelligence artificielle. Pourtant, il existe encore un vide quant à la manière d'évaluer la conformité des LLMs aux valeurs humaines importantes. Dans cet article, nous étudions si les LLMs à la pointe de la technologie, GPT-4 et Claude 2.1 (Gemini Pro et LLAMA 2 n'ont pas généré de résultats valides), sont des hypocrites moraux. Nous utilisons deux instruments de recherche basés sur la théorie des fondations morales : (i) le questionnaire des fondations morales (MFQ), qui étudie quelles valeurs sont considérées comme moralement pertinentes dans des jugements moraux abstraits ; et (ii) les vignettes des fondations morales (MFVs), qui évaluent la cognition morale dans des scénarios concrets liés à chaque fondation morale. Nous caractérisons les conflits de valeurs entre ces différentes abstractions de l'évaluation morale comme de l'hypocrisie. Nous avons constaté que les deux modèles ont affiché une cohérence raisonnable au sein de chaque instrument comparativement aux humains, mais qu'ils ont manifesté un comportement contradictoire et hypocrite lorsque nous avons comparé les valeurs abstraites présentes dans le MFQ à l'évaluation des violations morales concrètes du MFV.
Building similarity graph...
Analyzing shared references across papers
Loading...
José Luiz Nunes
Guilherme Almeida
Marcelo de Araújo
Building similarity graph...
Analyzing shared references across papers
Loading...
Nunes et al. (ven,) ont étudié cette question.
www.synapsesocial.com/papers/68e69aefb6db643587620735 — DOI: https://doi.org/10.48550/arxiv.2405.11100
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: