Key points are not available for this paper at this time.
진단 오류는 중대한 건강 위험을 초래하며 환자 사망률에도 기여합니다. 전자의무기록의 접근성이 증가함에 따라 머신러닝 모델은 진단의 질을 향상시키는 유망한 수단을 제공합니다. 현재 연구는 충분한 교육 데이터를 가진 제한된 질환군에 주로 초점을 맞추고 있어, 데이터가 부족한 진단 상황은 간과되고 있습니다. 본 연구는 데이터 희소성을 수용하여 폭넓은 진단 의사결정 지원을 가능하게 하는 정보 검색(IR) 기반 프레임워크 개발을 목표로 합니다. 우리는 CliniqIR이라 불리는 IR 기반 진단 의사결정 지원 프레임워크를 제안하였습니다. 이는 임상 텍스트 기록, 통합 의학 언어 시스템 메타서로우스, 그리고 3,300만 건의 PubMed 초록을 활용하여 교육 데이터 유무와 관계없이 광범위한 진단을 분류합니다. CliniqIR은 모든 IR 프레임워크와 호환되도록 설계되어, 밀집 및 희소 검색 방식을 모두 이용하여 구현하였습니다. CliniqIR의 성능을 감독 학습 및 제로샷 설정에서 Clinical Bidirectional Encoder Representations from Transformers(ClinicalBERT)와 같은 사전학습된 임상 변환기 모델과 비교하였습니다. 이후 감독 미세조정된 ClinicalBERT와 CliniqIR의 강점을 결합해 최첨단 진단 예측을 제공하는 앙상블 프레임워크를 구축하였습니다. 훈련 데이터가 없는 복잡한 진단 데이터 세트(DC3)에서 CliniqIR 모델들은 상위 3개 예측 내에 올바른 진단을 반환하였습니다. Medical Information Mart for Intensive Care III 데이터 세트에서는 CliniqIR 모델들이 <5개의 훈련 샘플로 진단 예측 시 ClinicalBERT를 평균 역순위 지수 0.10 차이로 능가하였습니다. 질병 특정 훈련이 없는 제로샷 상황에서도 CliniqIR은 사전학습된 변환기 모델보다 최소 0.10 이상의 더 높은 평균 역순위 지수를 기록하며 우수한 성능을 보였습니다. 더불어 대부분의 조건에서 앙상블 프레임워크는 개별 구성요소의 성능을 뛰어넘어 정밀한 진단 예측 능력이 향상됨을 시사하였습니다. 우리의 실험은 드물게 접하는 진단을 식별하는 데 있어 비정형 지식 자원을 활용하는 IR의 중요성을 부각합니다. 또한 앙상블 프레임워크는 감독 학습 모형과 검색 기반 모델의 상호 보완적 강점을 결합하여 다양한 질환 진단에 유익함을 확인하였습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Tassallah Abdullahi
Laura Mercurio
Ritambhara Singh
JMIR Medical Informatics
Brown University
University of Tübingen
Building similarity graph...
Analyzing shared references across papers
Loading...
Abdullahi 등(Wed,)이 이 문제를 연구하였습니다.
www.synapsesocial.com/papers/68e6eaccb6db643587665fc7 — DOI: https://doi.org/10.2196/50209
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: