What type of study is this?

This is a Quantitative Study study.

October 2, 2025Open Access

الفيزياء المتعددة: معيار شامل لقدرات استدلال نماذج اللغة الكبيرة متعددة الأنماط على مسائل فيزياء متعددة المواضيع بالصينية

Key Points

يتضمن معيار Multi-Physics 1412 سؤالًا مرتبطًا بالصور عبر 11 موضوع فيزياء، مما يعزز من جودة التقييم.
باستخدام إطار تقييم ثنائي، يُحلل دقة نماذج MLLMs وسلامة عملية الاستدلال الخاصة بها عبر سلسلة التفكير.
تدرس الدراسة بشكل منهجي دور المعلومات البصرية من خلال مقارنة أداء MLLMs مع أوضاع إدخال مختلفة.
يهدف هذا المصدر إلى تحسين تقييم الاستدلال متعدد الأنماط ويعزز فهم مقاييس الفيزياء المتخصصة.

Abstract

بينما تُظهر نماذج اللغة الكبيرة متعددة الأنماط (MLLMs) تقدمًا ملحوظًا في الاستدلال، فإن تطبيقها في المجالات العلمية المتخصصة مثل الفيزياء يكشف عن فجوات كبيرة في مقاييس التقييم الحالية. على وجه التحديد، غالبًا ما تفتقر المقاييس الموجودة إلى تغطية موضوعية دقيقة، وتتجاهل عملية الاستدلال خطوة بخطوة، كما أنها تركز بشكل أساسي على اللغة الإنجليزية، مما يفشل في تقييم دور المعلومات البصرية بشكل منهجي. لذلك، نقدم معيار Multi-Physics للاستدلال الفيزيائي باللغة الصينية، وهو معيار شامل يشمل 5 مستويات صعوبة، ويتضمن 1412 سؤالًا متعدد الخيارات مرتبطًا بالصور يغطي 11 موضوعًا فيزياء لمرحلة التعليم الثانوي. نستخدم إطار تقييم ثنائي لتقييم 20 نموذجًا مختلفًا من MLLMs، حيث نحلل دقة الإجابة النهائية وسلامة سلسلة التفكير خطوة بخطوة. علاوة على ذلك، ندرس بشكل منهجي تأثير مستوى الصعوبة والمعلومات البصرية من خلال مقارنة أداء النماذج قبل وبعد تغيير وضع الإدخال. يوفر عملنا ليس فقط مصدرًا دقيقًا للمجتمع البحثي، بل يقدم أيضًا منهجية قوية لتفكيك عملية الاستدلال متعددة الأنماط لنماذج اللغة الكبيرة المتطورة، كما أن بياناتنا البرمجية قد تم إصدارها كمصدر مفتوح: https: //github. com/luozhongze/Multi-Physics.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Z.-Q. Luo

Yin Zhou

Yong‐Xin Guo

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

الفيزياء المتعددة: معيار شامل لقدرات استدلال نماذج اللغة الكبيرة متعددة الأنماط على مسائل فيزياء متعددة المواضيع بالصينية

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider