Zusammenfassung Während künstliche Intelligenzsysteme zunehmend in sozial sensiblen Kontexten eingebettet werden, stellt sich eine zentrale Frage: Können sie komplexe Formen menschlicher sozialer Kognition replizieren? Um diese Frage zu untersuchen, entwickelten und validierten wir eine neuartige kognitive Empathie-Aufgabe mit Ganzgesicht, die nuancierte Dimensionen wie moralisches Urteil, Intentionen-Attribution und zwischenmenschliches Vertrauen erforscht. Die Aufgabe wurde 230 menschlichen Teilnehmern und fünf führenden künstlichen Intelligenzmodellen (ChatGPT-4o, Claude, Gemini, Grok und Mistral) vorgelegt. Die hierarchische Clusteranalyse basierend auf der Jaccard-Distanz zeigte, dass ChatGPT-4o, Grok und Gemini einen kohärenten Cluster bildeten, der eng mit den in der menschlichen Stichprobe beobachteten Antworten übereinstimmt, während Claude abwich und Mistral eine teilweise Überlappung zeigte. Fishers exakte Tests bestätigten, dass sich der ChatGPT-Grok-Gemini-Cluster in allen Dimensionen minimal von den Menschen unterschied. Diese Ergebnisse zeigen, dass allgemein einsetzbare künstliche Intelligenzsysteme nun funktional nuancierte Dimensionen des kognitiven Empathie-Schlussfolgerns simulieren können, wie ihre Übereinstimmung mit dem Antwortmuster der menschlichen Teilnehmer dieser Studie mit überraschender Genauigkeit widerspiegelt. Dies eröffnet die Tür zu Anwendungen in der realen Welt wie sozial-kognitive virtuelle Assistenten, diagnostische Werkzeuge im Bereich psychischer Gesundheit, Konfliktlösungsysteme, sozial bewusste Roboter und adaptive Bildungsplattformen. Dennoch mahnt die beobachtete Variabilität zwischen den Modellen dazu, keine einheitliche Leistung vorauszusetzen. Unser Paradigma bietet einen rigorosen Benchmark zur Bewertung sozialer Kognition in künstlicher Intelligenz und unterstützt deren verantwortungsvolle Anwendung in sozial komplexen Umgebungen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Carlota Márquez-Pedregal
Ospedale San Giacomo Apostolo
Patricia Pantaleón-Menéndez
Hospital Universitario de Fuenlabrada
Óscar Delgado Ben Mohatar
Universidad Autónoma de Madrid
Royal Society Open Science
Universidad Autónoma de Madrid
Hospital Universitario Ramón y Cajal
Universidad Rey Juan Carlos
Building similarity graph...
Analyzing shared references across papers
Loading...
Márquez-Pedregal et al. (Mi,) untersuchten diese Fragestellung.
synapsesocial.com/papers/69d8968f6c1944d70ce080aa — DOI: https://doi.org/10.1098/rsos.251314
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: