يحرز GPT-o3 و Gemini-3-Flash استقرارًا ودقة متفوقة في الإجابة على أسئلة طب العيون، مما يجعلهما مناسبين لدعم اتخاذ القرار السريري عالي المخاطر. يظهر النموذج مفتوح المصدر DeepSeek-R1 قدرة تنافسية خاصة في المهام المعقدة. من الجدير بالملاحظة أن GPT-5 لم يتمكن من التفوق على سلفه في الدقة أو الاتساق في هذا المجال المتخصص. لهندسة المطالبات تأثير محدود على الأداء في الأسئلة الطبية ذات الإجابات المغلقة. ينبغي أن تمتد الأبحاث المستقبلية إلى التكامل متعدد الوسائط والتحقق السريري في العالم الواقعي لتعزيز الفائدة العملية وموثوقية نماذج اللغة الكبيرة في الطب.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ping Zhang
Jiaoman Wang
Xinya Hu
Frontiers in Cell and Developmental Biology
Wenzhou Medical University
Shenzhen Second People's Hospital
Affiliated Eye Hospital of Wenzhou Medical College
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Zhang وآخرون (Thu,) هذا السؤال.
www.synapsesocial.com/papers/69a75cdec6e9836116a261ac — DOI: https://doi.org/10.3389/fcell.2026.1744389