March 5, 2024Open Access

مزيج LoRAs: ضبط متعدد المهام بكفاءة لنماذج اللغة الكبيرة

Key Points

تحسين الأداء في تعلم المهام المتعددة يمنع النسيان الكارثي والتداخل.
تُظهر التجارب أداءً متفوقًا مقارنة بأساليب الضبط التقليدية لنماذج اللغة الكبيرة.
تجمع بنية Mixture-of-LoRAs وحدات LoRA المتخصصة في المجالات لتدريب متعدد المهام بكفاءة والتكيف مع المجالات الجديدة بسهولة ومرونة. يتكيف كل نموذج بسرعة مع المجالات الخاصة، داعمًا تطبيقات لغوية متنوعة عبر مهام متعددة.

Abstract

يتمتع ضبط التعليمات بالقدرة على تحفيز أو تعزيز قدرات محددة في نماذج اللغة الكبيرة (LLMs). ومع ذلك، فإن تحقيق التوازن المناسب في البيانات أمر بالغ الأهمية لمنع النسيان الكارثي والتداخل بين المهام. لمعالجة هذه القيود وتعزيز مرونة التدريب، نقترح بنية Mixture-of-LoRAs (MoA) وهي طريقة ضبط جديدة وفعالة في استخدام المعلمات مصممة لتعلم المهام المتعددة مع LLMs. في هذه الورقة، نبدأ بتدريب عدة وحدات LoRA متخصصة في مجالات مختلفة بشكل فردي باستخدام بيانات مجموعات بيانات خاضعة للإشراف تتوافق مع كل مجال. يمكن مواءمة هذه الوحدات مع مبادئ تصميم الخبراء التي تم ملاحظتها في Mixture-of-Experts (MoE). بعد ذلك، ندمج عدة وحدات LoRA باستخدام استراتيجية توجيه صريحة ونقدم ملصقات المجالات لتسهيل تعلم المهام المتعددة، مما يساعد على منع التداخل بين المهام ويعزز في النهاية أداء كل مهمة على حدة. علاوة على ذلك، يمكن تكييف كل نموذج LoRA بشكل متكرر إلى مجال جديد، مما يسمح بالتكيف السريع الخاص بالمجال. أظهرت التجارب على مهام متنوعة أداءً متفوقًا وقويًا، مما يمكن أن يعزز تطبيق نطاق واسع للنماذج اللغوية الكبيرة الخاصة بالمجال.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Wenfeng Feng

Chuzhan Hao

Yuewei Zhang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

مزيج LoRAs: ضبط متعدد المهام بكفاءة لنماذج اللغة الكبيرة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider