Key points are not available for this paper at this time.
يقدم هذا العمل طريقة فعالة لتوسيع نماذج اللغة الكبيرة (LLMs) المبنية على المحولات لتتعامل مع مدخلات ذات طول لا نهائي مع ذاكرة وحوسبة محدودة. أحد المكونات الرئيسية في نهجنا المقترح هو تقنية انتباه جديدة تسمى الانتباه اللامتناهي. يدمج الانتباه اللامتناهي ذاكرة تضغيطية في آلية الانتباه الأصلية ويجمع بين انتباه محلي مقنع وانتباه خطي طويل المدى في كتلة محول واحدة. نُظهر فعالية نهجنا على معايير نمذجة اللغة ذات السياق الطويل، واسترجاع كتل سياق طولها 1 مليون تسلسل، ومهام تلخيص كتب بطول 500 ألف مع نماذج LLMs بحجم 1 مليار و8 مليار. يقدم نهجنا معلمات ذاكرة محدودة صغيرة ويُمكّن من استدلال سريع وبث مباشر لنماذج LLMs.
Building similarity graph...
Analyzing shared references across papers
Loading...
Tsendsuren Munkhdalai
Manaal Faruqui
Siddharth Gopal
Building similarity graph...
Analyzing shared references across papers
Loading...
درس مونكدالاي وآخرون هذا السؤال.
www.synapsesocial.com/papers/68e6f97db6db643587674396 — DOI: https://doi.org/10.48550/arxiv.2404.07143
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: