What type of study is this?

This is a Quantitative Study study.

October 11, 2025Open Access

Jenseits menschlichen Urteilsvermögens: Eine bayessche Bewertung des moralischen Werteverständnisses von LLMs

Key Points

KI-Modelle rangieren typischerweise unter den besten 25 % menschlicher Annotatoren und zeigen damit ihre überlegene Leistung in der moralischen Bewertung.
Die Analyse verarbeitete über 1 Million Modellabfragen und hebt KIs Fähigkeiten im moralischen Werteverständnis über diverse Texte hervor.
Diese Bewertungsmethode erfasst sowohl aleatorische als auch epistemische Unsicherheiten und bietet so einen umfassenden Einblick in die Modellleistung.
KI erzeugt deutlich weniger falsch negative Ergebnisse im Vergleich zu Menschen, was deren erhöhte Sensitivität bei der Erkennung moralischer Aspekte zeigt.

Abstract

Wie verstehen Large Language Models moralische Dimensionen im Vergleich zu Menschen? Diese erste groß angelegte bayessche Bewertung marktführender Sprachmodelle liefert die Antwort. Im Gegensatz zu früheren Arbeiten, die deterministische Wahrheiten (Mehrheits- oder Inklusionsregeln) verwenden, modellieren wir Annotator-Streitigkeiten, um sowohl aleatorische Unsicherheit (inhärente menschliche Uneinigkeit) als auch epistemische Unsicherheit (Modellsensitivität gegenüber Domänen) zu erfassen. Wir bewerteten die besten Sprachmodelle (Claude Sonnet 4, DeepSeek-V3, Llama 4 Maverick) anhand von über 250.000 Annotationen von fast 700 Annotatoren in mehr als 100.000 Texten aus sozialen Netzwerken, Nachrichten und Foren. Unser GPU-optimierter bayesscher Rahmen verarbeitete über 1 Million Modellabfragen und zeigte, dass KI-Modelle in der Regel unter den besten 25 % der menschlichen Annotatoren rangieren und eine wesentlich bessere durchschnittliche ausgewogene Genauigkeit erzielen. Wichtig ist, dass KI deutlich weniger falsch negative Ergebnisse produziert als Menschen, was auf ihre sensibleren Fähigkeiten zur moralischen Erkennung hinweist.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Maciej Skórski

Alina Landowska

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Jenseits menschlichen Urteilsvermögens: Eine bayessche Bewertung des moralischen Werteverständnisses von LLMs

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider