العديد من مسائل الرياضيات في المرحلة الإعدادية تعتمد على الصور: حيث يحتوي الرسم البياني أو المخطط على معلومات أساسية. هذا مهم في التدريس الذكي وإمكانية الوصول، حيث يجب على الأنظمة الاستدلال بناءً على الأشكال ويرفضون المسؤولية عند فقدان الأشكال. قمنا بتقييم ستة نماذج لغوية متعددة الوسائط كبيرة معاصرة—ثلاثة نماذج استدلالية وثلاثة نماذج غير استدلالية—على 376 مسألة من مواد Illustrative Mathematics (IM) المصنفة على أنها تتطلب دور الصورة (الشكل يحتوي على معلومات حاسمة للمهمة لا يمكن استنتاجها من النص فقط دون فرضيات إضافية). يحاول كل نموذج حل كل مسألة ثلاث مرات مع وجود الشكل ودونه ضمن سياق موحد ومنهجية تقييم موحدة. لتقليل الذاتية في تصنيف دور الصورة، صنفنا المسائل على أنها لا تتطلب الصورة عندما يمكن حلها من النص فقط دون فرضيات إضافية. مع الصور، حققت أفضل النماذج الاستدلالية دقة في منتصف الخمسينات بالمئة، بينما حققت النماذج غير الاستدلالية دقة في منتصف الثلاثينات إلى أوائل الأربعينات. بدون الصور، رفضت النماذج الإجابة بشكل كاسح بدلاً من التخمين، مع وجود إجابات صحيحة نادرة بالصدفة. أظهرت النماذج اتفاقاً معتدلاً بشأن المسائل التي يمكن حلها، ونصدر مجموعتين مرجعيتين من المسائل التي تم حلها باستمرار عبر النماذج. يكشف تدقيق نوعي لـ 83 مسألة أن الخطأ الأكبر للنماذج غير الاستدلالية هو قراءة بصرية خاطئة، بينما تنتج النماذج الاستدلالية إجابات صحيحة ترافقها تفسيرات كافية في أغلب الأحيان. تشير هذه النتائج إلى أن أنظمة التدريس يجب أن تضع قيوداً على التقييم الآلي وتحديثات نماذج المتعلمين بناءً على توفر الأدلة البصرية وتستخدم استراتيجيات مساعدة تشترط الربط الصريح مع الأدلة البصرية قبل الجبر. من أجل إمكانية الوصول، يجب على الأنظمة التعامل مع رفض الإجابة بدون صورة كإشارة على فقدان السياق واستدعاء الشكل أو وصف منظم، مما يتيح تجارب استبدال الوصف. ننشر الكود، التعليمات، والملخصات لإعادة التجربة. الكود والبيانات: https://osf.io/ct7bg/
Building similarity graph...
Analyzing shared references across papers
Loading...
Ethan Croteau
Neil T. Heffernan
Worcester Polytechnic Institute
Building similarity graph...
Analyzing shared references across papers
Loading...
درس كروتو وآخرون (Sat,) هذا السؤال.
www.synapsesocial.com/papers/69d49fa9b33cc4c35a2280db — DOI: https://doi.org/10.5281/zenodo.19420819
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: