What type of study is this?

September 10, 2025

mLoRA: تحسين إعدادات LoRA عبر التوازي الخطي عالي الكفاءة في وحدات معالجة الرسوميات المتعددة

Key Points

يُمكّن mLoRA الضبط الدقيق المتزامن لنموذجين Llama-2-13B على أربع وحدات معالجة رسوميات، مما يزيد من الكفاءة والإتاحة.
يمكن تقليل متوسط وقت إتمام مهام الضبط الدقيق بنسبة 30٪ مقارنةً بالطرق الحالية مثل FSDP.
يعزز مخطط التوازي الخيطي الواعي لـ LoRA استغلال وحدات معالجة الرسوميات ويقلل من عبء الاتصال.
تسمح هذه المقاربة للمطورين بتكييف نماذج اللغة الكبيرة مع مهام متعددة في وقت واحد، مما يعزز الحلول ذات التكلفة الفعالة.

Abstract

أظهرت نماذج اللغة الكبيرة القائمة على المحولات أداءً ممتازًا عبر مجالات متنوعة، خاصة في نمط التدريب الناشئ المتمثل في التدريب المسبق ثم التخصيص الدقيق. تُعد LoRA طريقة فعالة من حيث المعلمات لضبط النماذج بدقة، وتستخدم عادةً لتكييف نموذج اللغة الأساسي مع مهام متعددة لاحقة. علاوة على ذلك، تتيح منصات نماذج اللغة للمطورين ضبط نماذج متعددة وتطوير تطبيقات متخصصة متعددة المجالات في وقت واحد. ومع ذلك، تعاني طرق التوازي النموذجي القائمة من عبء اتصال مرتفع واستغلال غير فعال لوحدات معالجة الرسوميات. في هذه الورقة، نقدم mLoRA، وهو نظام ضبط دقيق فعال من حيث التوازي مصمم لتدريب عدة LoRA عبر وحدات معالجة الرسوميات والأجهزة. يقدم mLoRA مخطط توازي خيطي جديد يتعرف على LoRA، يقوم بتوزيع محولات LoRA ومراحل الضبط الدقيقة المميزة لها عبر وحدات معالجة الرسوميات والأجهزة بكفاءة، إلى جانب مشغل جديد فعال لـ LoRA لتحسين استغلال وحدات معالجة الرسوميات. تُظهر تقييماتنا الواسعة أن mLoRA يمكنه تقليل متوسط وقت إتمام مهمة الضبط الدقيق بشكل كبير، مثلاً بنسبة 30٪ مقارنةً بأساليب متقدمة مثل FSDP. الأهم من ذلك، يتيح mLoRA الضبط الدقيق المتزامن لنماذج أكبر، مثلاً نموذجين Llama-2-13B على أربع وحدات NVIDIA RTX A6000 بسعة 48GB، وهو ما لا يمكن تحقيقه باستخدام FSDP بسبب متطلبات الذاكرة العالية. لذلك، لا يزيد mLoRA من كفاءة الضبط الدقيق فحسب، بل يجعله أكثر وصولاً على وحدات معالجة الرسوميات ذات التكلفة الفعالة.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zhengmao Ye

Dengchun Li

Zhibin Hu

Journals

Proceedings of the VLDB Endowment

Actions

Institutions

Sichuan University

The University of Texas at Arlington

Academia Sinica

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

mLoRA: تحسين إعدادات LoRA عبر التوازي الخطي عالي الكفاءة في وحدات معالجة الرسوميات المتعددة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider