What type of study is this?

This is a Experimental Study study.

October 13, 2025Open Access

لماذا يعتبر التفكير المكاني صعبًا على نماذج اللغة والرؤية؟ منظور آلية الانتباه على مناطق التركيز

Key Points

محاذاة النموذج لتوزيع الانتباه مع مواقع الكائنات أمر حاسم للنجاح في التفكير المكاني.
يعزز ADAPTVIS تركيز الانتباه على المناطق ذات الصلة السياقية، مما يؤدي إلى تحسينات كبيرة في المعايير.
تكشف الملاحظات أن العلاقات المكانية المألوفة تتم معالجتها بسهولة أكبر مقارنة بالعلاقات غير المألوفة.
تظهر الطريقة الخالية من التدريب تحسينات في المعايير الرئيسية مثل WhatsUp وVSR دون تكاليف كبيرة.

Abstract

لطالما واجهت نماذج اللغة والرؤية الكبيرة (VLMs) صعوبات في مهام التفكير المكاني. من المدهش أن مهام التفكير المكاني البسيطة، مثل التعرف على علاقات "تحت" أو "خلف" بين كائنين فقط، تشكل تحديات كبيرة للنماذج الحالية. في هذا العمل، ندرس تحدي التفكير المكاني من منظور التفسير الميكانيكي، حيث نستعرض الحالات الداخلية للنموذج لفحص التفاعلات بين رموز الصورة والنص. من خلال تتبع توزيع الانتباه عبر الصورة خلال الطبقات المتوسطة، نلاحظ أن النجاح في التفكير المكاني يرتبط ارتباطًا وثيقًا بقدرة النموذج على محاذاة توزيع انتباهه مع المواقع الفعلية للكائنات، وخاصة الفارق بين العلاقات المكانية المألوفة وغير المألوفة. بناءً على هذه النتائج، نقترح ADAPTVIS المعتمد على درجات الثقة أثناء الاستدلال لشحذ الانتباه على المناطق ذات الصلة العالية عند وجود ثقة، بينما يتم تنعيم وتوسيع نافذة الانتباه للنظر في سياق أوسع عندما تكون الثقة أقل. تُظهر هذه الطريقة في فك التشفير الخالية من التدريب تحسنًا كبيرًا (مثل تحسن يصل إلى 50 نقطة مطلقة) في معايير التفكير المكاني مثل WhatsUp وVSR بتكلفة ضئيلة جدًا. نحن نوفر الكود والبيانات للاستخدام البحثي على https://github.com/shiqichen17/AdaptVis.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Shiqi Chen

Tongyao Zhu

Ruochen Zhou

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

لماذا يعتبر التفكير المكاني صعبًا على نماذج اللغة والرؤية؟ منظور آلية الانتباه على مناطق التركيز

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider