Key points are not available for this paper at this time.
يتيح ضبط التعليمات لنماذج اللغة المدربة مسبقًا أداء مهام جديدة من أوصاف اللغة الطبيعية وقت الاستدلال. تعتمد هذه الأساليب على كميات هائلة من الإشراف البشري في شكل مجموعات بيانات من مصادر جماعية أو تفاعلات المستخدمين. في هذا العمل، نقدم "التعليمات غير الطبيعية": مجموعة بيانات كبيرة من التعليمات الإبداعية والمتنوعة، جمعت تقريبًا دون أي جهد بشري. نجمع 64000 مثال عن طريق تحفيز نموذج لغة بثلاثة أمثلة أولية من التعليمات ومن ثم استدعاء مثال رابع. ثم يتم توسيع هذه المجموعة عن طريق تحفيز النموذج لإعادة صياغة كل تعليمات، مما يخلق ما مجموعه حوالي 240000 مثال من التعليمات والمدخلات والمخرجات. تظهر التجارب أنه رغم احتوائها على كمية ملحوظة من الضوضاء، فإن التدريب على التعليمات غير الطبيعية ينافس فعالية التدريب على مجموعات بيانات مفتوحة المصدر ومنسقة يدويًا، متفوقًا على أداء نماذج مثل T0++ وTk-Instruct عبر معايير مختلفة. تبرز هذه النتائج إمكانات البيانات المولدة بواسطة النموذج كبديل ذات تكلفة فعالة للجمع الجماعي لتوسيع وتنويع مجموعات البيانات.
Building similarity graph...
Analyzing shared references across papers
Loading...
Or Honovich
Thomas Scialom
Omer Levy
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Honovich وآخرون (Sun,) هذا السؤال.
www.synapsesocial.com/papers/69d757f5f182769aa8b8a696 — DOI: https://doi.org/10.18653/v1/2023.acl-long.806
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: