What type of study is this?

This is a Systematic Review study (also classified as: Experimental Study).

October 12, 2025Open Access

من الطويل إلى القصير: النماذج اللغوية الكبيرة تتفوق في تقصير سلاسل التفكير الخاصة بها

Key Points

تحسن EDIT كفاءة التفكير، منتجة مخرجات أوضح تعزز تجربة المستخدم.
تظهر التجارب المكثفة أن EDIT توازن بفعالية بين الإيجاز والصحة عبر نماذج مختلفة.
تكشف الدراسة عن تحديات تواجهها LRMs في إدارة أهداف توليد متعددة، مؤكدة الحاجة إلى الكفاءة.
باستخدام التدرج الزمني أثناء الاختبار، توجه EDIT النماذج للعثور على أقصر مسارات تفكير دقيقة، مما يخفف من الإفراط في التفكير.

Abstract

الإصدارات الكبيرة للأسلوب O1/R1 من نماذج التفكير الكبيرة (LRMs) تشير إلى قفزة كبيرة مقارنة بالنماذج اللغوية الكبيرة التقليدية التي تتبع التعليمات. من خلال تطبيق التدرج الزمني أثناء الاختبار لتوليد مسارات تفكير ممتدة، تحقق العديد من الأرقام القياسية في مجموعة واسعة من مهام التفكير المعقدة. ومع ذلك، تظهر دراسات حديثة أن LRMs معرضة للمعاناة من الإفراط في التفكير – الميل إلى تعقيد المشاكل البسيطة بشكل مفرط، مما يؤدي إلى تبديل استراتيجيات مفرط ومسارات تفكير طويلة ومعقدة تعيق سهولة تفسيرها. للتخفيف من هذه المشكلة، أجرينا تحقيقاً منهجياً في كفاءة التفكير لمجموعة واسعة من LRMs وكشفنا عن معضلة شائعة: صعوبة الموازنة بين أهداف التوليد المتعددة مثل الصحة والإيجاز. بناءً على هذا الاكتشاف، نقترح طريقة تدرج أثناء الاختبار، EDIT (اقتطاع الاستدلال الديناميكي الفعال)، التي توجه LRMs بكفاءة لتحديد أقصر مسارات تفكير صحيحة أثناء الاختبار. تستخدم EDIT التوليد الموجه بالقيد مع تتبع مشترك لطول التوليد وتوزيعات الإجابات تحت قيود متغيرة، مما يسمح لها باختيار الردود التي تحقق توازناً مثالياً بين الإيجاز والصحة. تظهر تجارب موسعة عبر نماذج ومجموعات بيانات متنوعة أن EDIT تعزز بشكل كبير كفاءة التفكير، منتجة مخرجات مضغوطة ومفيدة تحسن من قابلية القراءة وتجربة المستخدم.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Wei Han

Geng Zhan

Sicheng Yu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

من الطويل إلى القصير: النماذج اللغوية الكبيرة تتفوق في تقصير سلاسل التفكير الخاصة بها

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study