What question did this study set out to answer?

Diese Forschung zielt darauf ab, zu bewerten, wie demografische Merkmale Kandidatenrankings in KI-gesteuerten HR-Systemen anhand eines kontrollierten Datensatzes beeinflussen.

March 12, 2026Open Access

Kartierung von Diskriminierung in von LLM gesteuerten HR-Systemen

Key Points

Diese Forschung zielt darauf ab, zu bewerten, wie demografische Merkmale Kandidatenrankings in KI-gesteuerten HR-Systemen anhand eines kontrollierten Datensatzes beeinflussen.
Erstellung eines ausgewogenen synthetischen Datensatzes mit 1.000 Kandidatenprofilen inklusive Anschreiben.
Bewertung von 28 verschiedenen großen Sprachmodellen, darunter sowohl proprietäre als auch Open-Source-Optionen.
Analyse des Einflusses sensibler Merkmale wie Rasse, Geschlecht und Alter auf die Kandidatenrankings.
76 %–80 % der beruflichen Attribute, wie Fähigkeiten und Erfahrung, beeinflussten die Rankings signifikant.
8 %–9 % der demografischen Merkmale zeigten über mehrere LLMs hinweg persistente Verzerrungen.
Entwicklung einer ‚Bias Map‘ zur Visualisierung der LLM-Leistung und Verzerrungen.

Abstract

Die Nachhaltigen Entwicklungsziele der Vereinten Nationen (UN SDGs) setzen den Fokus auf inklusive und faire Beschäftigung. KI-gestützte Rekrutierungswerkzeuge—insbesondere Large Language Models (LLMs)—lösen jedoch Bedenken hinsichtlich potenzieller demografischer Verzerrungen aus. Dieses Papier präsentiert einen kontrollierten synthetischen Datensatz und eine Methodik zur Messung, wie sensitive Merkmale (z.B. Rasse, Geschlecht, Alter) die Kandidatenranglisten und paarweisen Vergleiche in LLM-basierten Einstellungsprozessen beeinflussen. Konkret haben wir einen ausgewogenen Datensatz von 1.000 synthetischen Kandidatenprofilen (jeweils mit Anschreiben) erstellt und mit 28 führenden LLMs bewertet, darunter proprietäre (z.B. OpenAI GPT, Gemini, Grok, Claude) und Open-Source-Modelle (z.B. Llama, GigaChat). Synthetische Daten eliminieren reale demografische/berufliche Störfaktoren, sodass beobachtete Unterschiede ausschließlich das intrinsische Verhalten der LLMs widerspiegeln. Die Ergebnisse zeigen, dass berufliche Attribute (z.B. Fähigkeiten, Erfahrung) die primären Treiber der Ranglisten sind, mit 76 %–80 % statistischer Signifikanz; allerdings weisen 8 %–9 % der demografischen Merkmale über mehrere LLMs hinweg persistente, signifikante Verzerrungen auf. Wir entwickeln eine "Bias Map", die die Leistung der LLMs quantifiziert und betont, dass die Minderung selbst kleiner Verzerrungen im automatisierten Einstellungsprozess entscheidend ist, um die Fortsetzung von Ungleichheiten am Arbeitsplatz zu vermeiden und die inklusive Vision der UN SDGs zu wahren.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Eldar Jalilzade

Maksim Kalameyets

Shrikant Malviya

Actions

Institutions

Newcastle University

Durham University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Kartierung von Diskriminierung in von LLM gesteuerten HR-Systemen

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider