What question did this study set out to answer?

The aim is to develop and evaluate MIRA, a large language model, for generating accurate radiology impressions.

April 17, 2026Open Access

Fine-Tuned Large Language Models for Automated Radiology Impression Generation: A Multicenter Evaluation

Key Points

The aim is to develop and evaluate MIRA, a large language model, for generating accurate radiology impressions.
Compiled a retrospective dataset of 1.87 million radiology reports from 42 hospitals.
Fine-tuned MIRA using a prompt-based strategy.
Conducted blinded comparisons by 24 radiologists on internal and external datasets.
Utilized parametric and nonparametric tests for data analysis.
MIRA outperformed GPT-4o in both similarity and F1 score.
69% of MIRA-generated impressions were rated as good as reference impressions.
Drafting time was reduced by 0.46 minutes per report.
Interradiologist agreement increased significantly.

Abstract

Purpose To develop a fine-tuned large language model (Medical Imaging Report Assistant, MIRA) and evaluate its performance in generating radiology impressions from multicenter data with respect to accuracy, reporting efficiency, and clinical applicability. Materials and Methods A retrospective multicenter dataset comprising 1.87 million radiology reports (including CT, MRI, and digital radiography data) from 42 hospitals across 22 provinces in China (January 2019 to August 2024) was compiled. The dataset was used to fine-tune an LLM via a prompt-based strategy. The evaluation framework incorporated both automated and human evaluation metrics. Radiologists evaluated internal and external datasets and three open-source datasets to compare impressions generated by the fine-tuned LLM and GPT-4o. Twenty-four radiologists from six centers performed blinded comparisons of MIRA generated and reference impressions to assess interrater consistency and drafting efficiency. Data were analyzed using appropriate parametric/nonparametric tests and χ2 tests, with Holm-Bonferroni correction for multiple comparisons. Results The internal test set included data for 78,544 reports, median age, 52 years IQR, 35-65, 39,351 males) and the external test set included data for (27,471 reports, median age, 53 years IQR, 37-66, 13,955 males). Site/modality-aware prompting improved similarity (P n = 2,327) showed MIRA beat GPT-4o on both similarity and F1 score (P P < .001). Conclusion MIRA, a fine-tuned LLM using a prompt-based strategy, generated clinically aligned radiology impressions in multicenter settings, improving accuracy, efficiency, and reporting consistency. © The Authors 2026. Published by the Radiological Society of North America under a CC BY 4.0 license.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Li et al. (Wed,) studied this question.

www.synapsesocial.com/papers/69e1d0165cdc762e9d8592b7 — DOI: https://doi.org/10.1148/ryai.250714

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Systematic analysis of ChatGPT, Google search and Llama 2 for clinical decision support tasks· 2024 · 182 citations
Potential of GPT-4 for Detecting Errors in Radiology Reports: Implications for Reporting Accuracy· 2024 · 124 citations
The Role of Radiology in the Diagnostic Process: Information, Communication, and Teamwork· 2017 · 26 citations
BioBART: Pretraining and Evaluation of A Biomedical Generative Language Model· 2022 · 115 citations

Authors

Mingyang Li

Yue Wang

Zheng Miao

Journals

Radiology Artificial Intelligence

Actions

Institutions

Jilin University

Harbin Medical University

China Medical University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Fine-Tuned Large Language Models for Automated Radiology Impression Generation: A Multicenter Evaluation

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion