What question did this study set out to answer?

يهدف هذا البحث إلى تعزيز كفاءة ضبط المعلمات في سيناريوهات تعدد المهام باستخدام بنية جديدة تسمى SLoRA.

February 26, 2026Open Access

استكشاف بنية جديدة لضبط المعلمات بكفاءة في سيناريوهات تعدد المهام باستخدام SLoRA

Key Points

يهدف هذا البحث إلى تعزيز كفاءة ضبط المعلمات في سيناريوهات تعدد المهام باستخدام بنية جديدة تسمى SLoRA.
اقتُرحت بنية MoE لـ LoRA محسنة تسمى SLoRA.
استُخدم تحسين قيود التعامد لتقليل اضطراب المعرفة إلى الحد الأدنى.
طُورت بنية خبراء مختلطة تشمل خبراء عامين وخبراء خاصين بالمهام لتحسين التكيف.
قيّم الأداء على مهام التفكير السليم والمهام متعددة الوسائط باستخدام مجموعات بيانات محددة.
حقق معدل احتفاظ بدقة المهام القديمة بنسبة 92.4٪، متفوقًا على LoRA بنسبة 16.1٪.
حسن الدقة في مهام التفكير السليم بنسبة 9.0٪ مقارنة بـ LoRA و3.7٪ مقارنة بـ AdaLoRA.
عزز نتيجة F1 بنسبة 7.7٪ على CommonsenseQA و2.9٪ على نفس المهمة.
أظهر تحسنًا في المتوسط بنسبة 15.3٪ على LoRA في المهام متعددة الوسائط.

Abstract

نقترح بنية MoE لـ LoRA المحسنة (تكييف منخفض الرتبة)، SLoRA (البنية المحسنة لـ LoRA MoE)، التي تهدف إلى معالجة المشكلة الرئيسية لضبط المعلمات بكفاءة في سيناريوهات تعدد المهام. بالنظر إلى التكلفة العالية لإعادة الضبط الكامل التقليدي مع زيادة حجم المعلمات في نماذج اللغة المرئية، وقيود LoRA كطريقة شائعة لضبط المعلمات بكفاءة (PEFT) في تعدد المهام، مثل القابلية المحدودة للتكيف والصعوبة في التقاط أنماط المهام المعقدة، بالإضافة إلى تحديات النسيان الكارثي وتجزيء المعرفة التي تواجه الأبحاث الحالية في دمج آليات الخبراء المختلطة (MoE) في LoRA، يستخدم SLoRA تحسين قيود التعامد لتقليل الاضطراب على المعرفة القائمة من خلال تهيئة مساحة حل القيود، مما يخفف من النسيان الكارثي (معدل احتفاظ بدقة المهام القديمة يصل إلى 92.4٪، بزيادة 16.1٪ عن LoRA)، وبنية MoE محسنة تشمل خبراء عامين (يحافظون على المعرفة المدربة مسبقًا) وخبراء خاصين بالمهام (توجيه ديناميكي لمهام التكيف) لتعزيز القابلية للتكيف في تعدد المهام. أظهرت النتائج التجريبية أن دقة SLoRA في مهام التفكير السليم أعلى بنسبة 9.0٪ من LoRA و3.7٪ من AdaLoRA على مجموعة بيانات WSC، ونسبة F1 أعلى بنسبة 7.7٪ من LoRA و2.9٪ من AdaLoRA على مجموعة بيانات CommonsenseQA؛ وفي المهام متعددة الوسائط، بلغ متوسط نتيجته أعلى بنسبة 15.3٪ من LoRA، مما يظهر تفوقًا ملحوظًا على الطرق الموجودة.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Ce Shi

Jin-Woo Jung

Journals

Applied Sciences

Actions

Institutions

Dongguk University

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

استكشاف بنية جديدة لضبط المعلمات بكفاءة في سيناريوهات تعدد المهام باستخدام SLoRA

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider