What type of study is this?

This is a Quantitative Study study.

October 9, 2025Open Access

هل الضغط فعلاً خطي مع ذكاء الكود؟

Key Points

النتائج تظهر علاقة لوغاريتمية بين ذكاء الكود والبتات لكل حرف (BPC)، مما يتحدى الافتراضات السابقة.
الدراسة تستخدم مجموعة متنوعة من نماذج Code LLM مفتوحة المصدر تم تقييمها على معايير متعددة اللغات والمهام.
تم تقديم Format Annealing كمنهجية شفافة لتعزيز العدل والكفاءة في تقييم النماذج.
النتائج تشير إلى أن الادعاءات السابقة بالخطية في الضغط قد تعكس ظروف ملاحظة محدودة بدلاً من حقائق مطلقة.

Abstract

فهم العلاقة بين ضغط البيانات وقدرات نماذج اللغة الكبيرة (LLMs) أمر حاسم، خاصة في المجالات المتخصصة مثل ذكاء الكود. الأعمال السابقة افترضت علاقة خطية بين الضغط والذكاء العام. ومع ذلك، تجاهلت الطبيعة متعددة الأوجه للكود التي تشمل لغات برمجة متنوعة ومهام مختلفة، وكافحت مع تقييم عادل لنماذج Code LLM الحديثة. نحن نعالج هذا من خلال تقييم مجموعة متنوعة من نماذج Code LLM مفتوحة المصدر على معايير شاملة متعددة اللغات والمهام. لمواجهة تحدي التقييم الفعال والعادل لذكاء الكود في نماذج LLM المدربة مسبقاً، نقدم "Format Annealing"، وهي منهجية تدريب خفيفة الوزن وشفافة تهدف إلى تقييم القدرات الجوهرية لهذه النماذج بصورة عادلة. تُقاس فعالية الضغط بوحدة البتات لكل حرف (BPC) باستخدام مجموعة تحقق جديدة كبيرة الحجم ولم تُرَ من قبل مشتقة من GitHub. تكشف نتائجنا التجريبية عن علاقة لوغاريتمية أساسية بين ذكاء الكود المقاس وBPC. هذه النتيجة تنقح الفرضيات السابقة بشأن الخطية، والتي نقترح أنها على الأرجح ملاحظات لذيل المنحنى اللوغاريتمي ضمن ظروف محدودة وخاصة. عملنا يقدم فهماً أكثر دقة لدور الضغط في تطوير ذكاء الكود ويسهم بإطار تقييم قوي في مجال الكود.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Shijie Xuyang

Xianzhen Luo

Tsung‐Chieh Cheng

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

هل الضغط فعلاً خطي مع ذكاء الكود؟

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider