What question did this study set out to answer?

Die Forschung zielt darauf ab zu untersuchen, ob KI komplexe menschliche soziale Kognition durch Gesichtsausdrücke nachbilden kann.

April 10, 2026Open Access

Hin zu funktionaler sozialer Kognition in Maschinen: Vergleich der Attribution mentaler Zustände von Menschen und KI anhand von Gesichtsausdrücken

Read Full Paperexternally

Key Points

Die Forschung zielt darauf ab zu untersuchen, ob KI komplexe menschliche soziale Kognition durch Gesichtsausdrücke nachbilden kann.
Entwicklung einer kognitiven Empathie-Aufgabe mit Fokus auf moralisches Urteil, Intentionen-Attribution und zwischenmenschliches Vertrauen.
Durchführung der Aufgabe mit 230 menschlichen Teilnehmern und fünf KI-Modellen (ChatGPT-4o, Claude, Gemini, Grok, Mistral).
Analyse der Antworten mittels hierarchischer Clusteranalyse und Fishers exakten Tests.
ChatGPT-4o, Grok und Gemini gruppierten sich nahe an menschlichen Antworten.
Claude wich signifikant ab, während Mistral eine teilweise Überlappung mit Menschen zeigte.
KI-Modelle demonstrierten die Fähigkeit, nuancierte kognitive Empathie-Schlussfolgerungen zu simulieren.

Abstract

Zusammenfassung Während künstliche Intelligenzsysteme zunehmend in sozial sensiblen Kontexten eingebettet werden, stellt sich eine zentrale Frage: Können sie komplexe Formen menschlicher sozialer Kognition replizieren? Um diese Frage zu untersuchen, entwickelten und validierten wir eine neuartige kognitive Empathie-Aufgabe mit Ganzgesicht, die nuancierte Dimensionen wie moralisches Urteil, Intentionen-Attribution und zwischenmenschliches Vertrauen erforscht. Die Aufgabe wurde 230 menschlichen Teilnehmern und fünf führenden künstlichen Intelligenzmodellen (ChatGPT-4o, Claude, Gemini, Grok und Mistral) vorgelegt. Die hierarchische Clusteranalyse basierend auf der Jaccard-Distanz zeigte, dass ChatGPT-4o, Grok und Gemini einen kohärenten Cluster bildeten, der eng mit den in der menschlichen Stichprobe beobachteten Antworten übereinstimmt, während Claude abwich und Mistral eine teilweise Überlappung zeigte. Fishers exakte Tests bestätigten, dass sich der ChatGPT-Grok-Gemini-Cluster in allen Dimensionen minimal von den Menschen unterschied. Diese Ergebnisse zeigen, dass allgemein einsetzbare künstliche Intelligenzsysteme nun funktional nuancierte Dimensionen des kognitiven Empathie-Schlussfolgerns simulieren können, wie ihre Übereinstimmung mit dem Antwortmuster der menschlichen Teilnehmer dieser Studie mit überraschender Genauigkeit widerspiegelt. Dies eröffnet die Tür zu Anwendungen in der realen Welt wie sozial-kognitive virtuelle Assistenten, diagnostische Werkzeuge im Bereich psychischer Gesundheit, Konfliktlösungsysteme, sozial bewusste Roboter und adaptive Bildungsplattformen. Dennoch mahnt die beobachtete Variabilität zwischen den Modellen dazu, keine einheitliche Leistung vorauszusetzen. Unser Paradigma bietet einen rigorosen Benchmark zur Bewertung sozialer Kognition in künstlicher Intelligenz und unterstützt deren verantwortungsvolle Anwendung in sozial komplexen Umgebungen.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Carlota Márquez-Pedregal

Ospedale San Giacomo Apostolo

Patricia Pantaleón-Menéndez

Hospital Universitario de Fuenlabrada

Óscar Delgado Ben Mohatar

Universidad Autónoma de Madrid

Journals

Royal Society Open Science

Actions

Institutions

Universidad Autónoma de Madrid

Hospital Universitario Ramón y Cajal

Universidad Rey Juan Carlos

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Hin zu funktionaler sozialer Kognition in Maschinen: Vergleich der Attribution mentaler Zustände von Menschen und KI anhand von Gesichtsausdrücken

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Also consider