June 22, 2024Open Access

ليدر: إطار عمل مستقل عن النموذج يعزز الترجمة الآلية القائمة على النماذج اللغوية الكبيرة إلى المستوى التالي

Key Points

Key points are not available for this paper at this time.

Abstract

تمكنت نماذج اللغة الكبيرة متعددة الأغراض مثل GPT-4 من تحقيق تقدم ملحوظ في الترجمة الآلية من خلال الاستفادة من محتوى الويب الواسع. من ناحية أخرى، تُنشأ نماذج اللغة المتخصصة في الترجمة من خلال التدريب المسبق على مجموعات بيانات أحادية اللغة خاصة بالمجالات والتدريب الدقيق باستخدام بيانات ترجمة مُعلمة بشريًا. على الرغم من الأداء المتفوق، تتطلب هذه الطرق إما موارد حوسبة وبيانات ضخمة غير مسبوقة أو جهود تحرير وتعليق بشري كبير. في هذه الورقة، نطور ليدر، أداة جديدة مستقلة عن النموذج وفعالة من حيث التكلفة لتحسين أداء النماذج العامة في الترجمة الآلية. يتم تدريب ليدر على ثلاثيات تحسين زائفة يمكن الحصول عليها بسهولة من النماذج الموجودة دون تكلفة بشرية إضافية. أثناء التدريب، نقترح استراتيجية تدريب دقيق هرمية مع منهج سهل إلى صعب لتحسين أداء ليدر تدريجيًا. يمكن دمج ليدر المدرب بسلاسة مع أي نموذج لغوي عام لتعزيز أداء الترجمة. باستخدام Gemma-2B/7B كقاعدة، يمكن لـ Ladder-2B رفع الترجمات الخام إلى مستوى النماذج مفتوحة المصدر الأعلى (مثل تحسين BigTranslate-13B بمقدار +6.91 BLEU و+3.52 COMET للزوج اللغوي XX-En)، ويمكن لـ Ladder-7B تعزيز الأداء ليكون منافسًا لأحدث نماذج GPT-4. تؤكد التجارب التحليلية المكثفة فعالية ليدر في بيئات متنوعة. الشيفرة متاحة على https://github.com/fzp0424/Ladder

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zhaopeng Feng

Ruizhe Chen

Yan Zhang

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

ليدر: إطار عمل مستقل عن النموذج يعزز الترجمة الآلية القائمة على النماذج اللغوية الكبيرة إلى المستوى التالي

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider