يتمتع ضبط التعليمات بالقدرة على تحفيز أو تعزيز قدرات محددة في نماذج اللغة الكبيرة (LLMs). ومع ذلك، فإن تحقيق التوازن المناسب في البيانات أمر بالغ الأهمية لمنع النسيان الكارثي والتداخل بين المهام. لمعالجة هذه القيود وتعزيز مرونة التدريب، نقترح بنية Mixture-of-LoRAs (MoA) وهي طريقة ضبط جديدة وفعالة في استخدام المعلمات مصممة لتعلم المهام المتعددة مع LLMs. في هذه الورقة، نبدأ بتدريب عدة وحدات LoRA متخصصة في مجالات مختلفة بشكل فردي باستخدام بيانات مجموعات بيانات خاضعة للإشراف تتوافق مع كل مجال. يمكن مواءمة هذه الوحدات مع مبادئ تصميم الخبراء التي تم ملاحظتها في Mixture-of-Experts (MoE). بعد ذلك، ندمج عدة وحدات LoRA باستخدام استراتيجية توجيه صريحة ونقدم ملصقات المجالات لتسهيل تعلم المهام المتعددة، مما يساعد على منع التداخل بين المهام ويعزز في النهاية أداء كل مهمة على حدة. علاوة على ذلك، يمكن تكييف كل نموذج LoRA بشكل متكرر إلى مجال جديد، مما يسمح بالتكيف السريع الخاص بالمجال. أظهرت التجارب على مهام متنوعة أداءً متفوقًا وقويًا، مما يمكن أن يعزز تطبيق نطاق واسع للنماذج اللغوية الكبيرة الخاصة بالمجال.
Building similarity graph...
Analyzing shared references across papers
Loading...
Wenfeng Feng
Chuzhan Hao
Yuewei Zhang
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Feng وآخرون (Tue,) هذا السؤال.
www.synapsesocial.com/papers/68e75a12b6db6435876d19ba — DOI: https://doi.org/10.48550/arxiv.2403.03432
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: