Große Sprachmodelle (LLMs) revolutionieren das Gesundheitswesen, indem sie eine Reihe administrativer und klinischer Aufgaben unterstützen; jedoch haben jüngste Studien Bedenken geäußert, dass sie bestehende Ungleichheiten im Gesundheitswesen verstärken könnten. Traditionelle algorithmische Audit-Ansätze reichen nicht aus, um die einzigartigen Herausforderungen der LLMs zu bewältigen, die komplexe textbasierte Eingaben verarbeiten und menschenähnliche Ausgaben erzeugen. In dieser Perspektive untersuchen wir aktuelle Ansätze zur Bewertung von Bias in LLMs in klinischen Umgebungen und identifizieren zentrale Lücken in bestehenden Audit-Methoden. Wir schlagen umfassende Richtlinien zur Kategorisierung und Erkennung von Bias in LLM-Anwendungen vor und veranschaulichen deren Anwendung anhand von zwei real eingesetzten Systemen – der Formulierung von Patientenantworten im Posteingang und Chatbots für psychische Gesundheit. Abschließend bieten wir konkrete Empfehlungen zur Weiterentwicklung der Bias-Bewertung von LLMs in einem sich schnell entwickelnden technologischen Umfeld.
Building similarity graph...
Analyzing shared references across papers
Loading...
Irene Y. Chen
Emily Alsentzer
NEJM AI
Stanford University
University of California, Berkeley
University of California, San Francisco
Building similarity graph...
Analyzing shared references across papers
Loading...
Chen et al. (Thu,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68c1d7ee54b1d3bfb60f9fd6 — DOI: https://doi.org/10.1056/aip2500015
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: