Key points are not available for this paper at this time.
تمكنت نماذج اللغة الكبيرة متعددة الأغراض مثل GPT-4 من تحقيق تقدم ملحوظ في الترجمة الآلية من خلال الاستفادة من محتوى الويب الواسع. من ناحية أخرى، تُنشأ نماذج اللغة المتخصصة في الترجمة من خلال التدريب المسبق على مجموعات بيانات أحادية اللغة خاصة بالمجالات والتدريب الدقيق باستخدام بيانات ترجمة مُعلمة بشريًا. على الرغم من الأداء المتفوق، تتطلب هذه الطرق إما موارد حوسبة وبيانات ضخمة غير مسبوقة أو جهود تحرير وتعليق بشري كبير. في هذه الورقة، نطور ليدر، أداة جديدة مستقلة عن النموذج وفعالة من حيث التكلفة لتحسين أداء النماذج العامة في الترجمة الآلية. يتم تدريب ليدر على ثلاثيات تحسين زائفة يمكن الحصول عليها بسهولة من النماذج الموجودة دون تكلفة بشرية إضافية. أثناء التدريب، نقترح استراتيجية تدريب دقيق هرمية مع منهج سهل إلى صعب لتحسين أداء ليدر تدريجيًا. يمكن دمج ليدر المدرب بسلاسة مع أي نموذج لغوي عام لتعزيز أداء الترجمة. باستخدام Gemma-2B/7B كقاعدة، يمكن لـ Ladder-2B رفع الترجمات الخام إلى مستوى النماذج مفتوحة المصدر الأعلى (مثل تحسين BigTranslate-13B بمقدار +6.91 BLEU و+3.52 COMET للزوج اللغوي XX-En)، ويمكن لـ Ladder-7B تعزيز الأداء ليكون منافسًا لأحدث نماذج GPT-4. تؤكد التجارب التحليلية المكثفة فعالية ليدر في بيئات متنوعة. الشيفرة متاحة على https://github.com/fzp0424/Ladder
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhaopeng Feng
Ruizhe Chen
Yan Zhang
Building similarity graph...
Analyzing shared references across papers
Loading...
درس فنغ وزملاؤه (Sat,) هذا السؤال.
www.synapsesocial.com/papers/68e63af7b6db6435875cd38c — DOI: https://doi.org/10.48550/arxiv.2406.15741
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: