July 30, 2024Open Access

OmniBal: نحو ضبط التعليمات السريع لنماذج الرؤية-اللغة عبر توازن حساب الأومنيفيرس

Key Points

Key points are not available for this paper at this time.

Abstract

مؤخرًا، حققت نماذج ضبط التعليمات للرؤية-اللغة تقدمًا كبيرًا بفضل فهمها الأكثر شمولية للعالم. في هذا العمل، اكتشفنا أن التدريب المتوازي واسع النطاق ثلاثي الأبعاد على تلك النماذج يؤدي إلى تحميل حسابي غير متوازن عبر الأجهزة المختلفة. أجزاء الرؤية واللغة هي متغايرة بطبيعتها: توزيع بياناتها وهيكل النموذج يختلفان بشكل كبير، ما يؤثر على كفاءة التدريب الموزع. أعادنا توازن الأحمال الحسابية من منظور البيانات والنموذج والذاكرة لمعالجة هذه المشكلة، محققين توازنًا أفضل في الحساب عبر الأجهزة. هذه المكونات الثلاثة ليست مستقلة بل مرتبطة ارتباطًا وثيقًا، مكونة إطار تدريب متوازن شامل. على وجه التحديد، بالنسبة للبيانات، قمنا بتجميع العينات في دفعات صغيرة متوازنة جديدة داخل الأجهزة وعبرها. بالنسبة للنموذج، استخدمنا طريقة بحث لتحقيق تقسيم أكثر توازنًا. بالنسبة لتحسين الذاكرة، قمنا بضبط استراتيجية إعادة الحساب لكل تقسيم بشكل تكيفي لاستغلال الذاكرة المتاحة بالكامل. أجرينا تجارب موسعة للتحقق من فعالية طريقتنا. مقارنةً بكود التدريب مفتوح المصدر لـ InternVL-Chat، خفّضنا بشكل كبير أيام استخدام GPU، محققين تسريعًا بحوالي 1.8 مرة. كما أُظهرت فعالية وعمومية طريقتنا عبر نماذج ومجموعات بيانات مختلفة. سيتم إصدار الأكواد عبر https://github.com/ModelTC/OmniBal.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yongqiang Yao

Jingru Tan

Jiahao Hu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

OmniBal: نحو ضبط التعليمات السريع لنماذج الرؤية-اللغة عبر توازن حساب الأومنيفيرس

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study