October 9, 2025Open Access

قوانين التدرج الفرعي: دور كثافة البيانات واستراتيجيات التدريب في نماذج اللغة الكبيرة

Key Points

تواجه تحسينات الأداء في نماذج اللغة عوائد متناقصة بسبب ظاهرة التدرج الفرعي.
تم فحص أكثر من 400 نموذج، وكشفت الدراسة أن كثافة البيانات العالية تؤثر سلبًا على الأداء.
العوامل الرئيسية التي تؤثر على التدرج الفرعي هي جودة البيانات وتخصيص الموارد الأمثل للتدريب.
يقدم قانون التدرج الفرعي غير المثالي المقترح توقعات أفضل للأداء في سيناريوهات التدرج الفرعي.

Abstract

تشير القوانين التقليدية للتدرج في معالجة اللغة الطبيعية إلى أن زيادة حجم النموذج وبيانات التدريب تعزز الأداء. ومع ذلك، تكشف الدراسات الحديثة عن انحرافات، لا سيما في نماذج اللغة الكبيرة، حيث تتباطأ تحسنات الأداء، وهي ظاهرة تعرف بالتدرج الفرعي. تعيد هذه الورقة النظر في هذه القوانين من خلال فحص تأثير جودة البيانات واستراتيجيات التدريب على أداء النموذج. من خلال تحليل تجريبي واسع لأكثر من 400 نموذج، نحدد أن كثافة البيانات العالية وتخصيص الموارد غير الأمثل هما العاملان الرئيسيان اللذان يساهما في التدرج الفرعي. تؤدي كثافة البيانات العالية إلى عوائد متناقصة بسبب المعلومات المتكررة، في حين أن تخصيص الموارد الأمثل ضروري لتحقيق تحسينات مستمرة في الأداء. نقترح قانون تدرج فرعي غير مثالي يتنبأ بشكل أفضل بالأداء في أنظمة التدرج الفرعي، مبرزين أهمية جودة وتنوع البيانات.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zhengyu Chen

Siqi Wang

Teng Xiao

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

قوانين التدرج الفرعي: دور كثافة البيانات واستراتيجيات التدريب في نماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider