Key points are not available for this paper at this time.
تدعم نماذج اللغة الكبيرة (LLMs) الآن نوافذ سياق طويلة للغاية، لكن التعقيد التربيعي للانتباه التقليدي يؤدي إلى زمن وصول أول رمز (TTFT) طويل بشكل ملحوظ. تتطلب الأساليب الحالية لمواجهة هذا التعقيد تدريبًا إضافيًا أو تحسينًا دقيقًا، وغالبًا ما تضحي بدقة النموذج. في هذه الورقة، نقدم أولاً أساسيات نظرية وتجريبية لانتباه متفرق شبه مفقود. وجدنا أن التقاط أنماط متفرقة محددة للرؤوس بشكل ديناميكي أثناء التشغيل مع تكلفة منخفضة أمر حاسم. لمعالجة ذلك، نقترح SampleAttention، وهو انتباه متفرق هيكلي تكيفي وشبه مفقود. يستفيد SampleAttention من أنماط متفرقة ملحوظة حيث يولي اهتمامًا لنسبة ثابتة من الرموز المجاورة لالتقاط أنماط النافذة المحلية، ويستخدم نهج تصفية القيم المفتاحية والاسئلة الموجهة على مرحلتين، يختار بشكل تكيفي أقل مجموعة من القيم المفتاحية بتكلفة منخفضة لالتقاط أنماط أعمدة الشريط. تظهر التقييمات الشاملة أن SampleAttention يمكن أن يحل محل الانتباه التقليدي في نماذج اللغة الكبيرة الجاهزة تقريبًا بدون فقدان في الدقة، ويقلل من TTFT بنسبة تصل إلى 2.42 مقارنة بـ FlashAttention.
Building similarity graph...
Analyzing shared references across papers
Loading...
Qianchao Zhu
Jiangfei Duan
Chang Chen
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Zhu وزملاؤه (Mon,) هذا السؤال.
www.synapsesocial.com/papers/68e64779b6db6435875d93fc — DOI: https://doi.org/10.48550/arxiv.2406.15486
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: