What type of study is this?

September 10, 2025

헬스케어에서 생성형 AI의 편향 감사 재정의

Key Points

현재 LLM 편향 평가 체계는 고유한 도전 과제를 충분히 다루지 못해 새로운 접근법이 필요합니다.
정신 건강 챗봇의 실제 사례들은 효과적인 감사 및 완화가 필요한 기존 편향을 부각시킵니다.
제안된 지침은 헬스케어 내 생성형 AI 응용에서 편향 탐지 및 분류를 향상시키는 것을 목표로 합니다.
새로운 감사 방법론은 기존 격차를 심화시킬 위험을 줄이고 건강 형평성을 개선할 수 있습니다.

Abstract

대형 언어 모델(LLM)은 다양한 행정 및 임상 업무를 지원하면서 헬스케어를 혁신하고 있습니다. 그러나 최근 연구들은 이들이 기존 헬스케어 불평등을 심화시킬 가능성에 대한 우려를 제기했습니다. 전통적인 알고리즘 감시 접근법은 복잡한 텍스트 기반 입력을 처리하고 인간과 유사한 출력을 생성하는 LLM이 제기하는 고유한 문제를 해결하는 데 한계가 있습니다. 본 관점에서는 임상 환경에서 LLM 편향 평가 현황을 검토하고 기존 감사 방법론의 주요 공백을 식별합니다. LLM 응용에서 편향을 분류하고 탐지하기 위한 포괄적 지침을 제안하며, 이를 실제 배포된 두 시스템인 인바스킷 환자 응답 작성과 정신 건강 챗봇 사례를 통해 보여줍니다. 마지막으로 빠르게 진화하는 기술 환경에서 LLM 편향 평가를 진전시키기 위한 구체적 권고를 제시합니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Irene Y. Chen

Emily Alsentzer

Journals

NEJM AI

Actions

Institutions

Stanford University

University of California, Berkeley

University of California, San Francisco

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

헬스케어에서 생성형 AI의 편향 감사 재정의

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider