تعد شبكات المحولات، المدفوعة بالانتباه الذاتي، مركزية لنماذج اللغة الكبيرة. في المحولات التوليدية، يستخدم الانتباه الذاتي ذاكرة التخزين المؤقت لتخزين إسقاطات الرموز، مما يتجنب إعادة الحساب في كل خطوة زمنية. ومع ذلك، يجب تحميل الإسقاطات المخزنة على وحدات معالجة الرسومات (GPU) إلى الذاكرة العشوائية الثابتة لكل خطوة توليد جديدة، مما يسبب تأخيرات واختناقات في الطاقة. هنا نقدم بنية حسابية مخصصة للانتباه الذاتي داخل الذاكرة تعتمد على ذواكر مشحونة جديدة تسمى خلايا الكسب، التي يمكن كتابتها بكفاءة لتخزين رموز جديدة أثناء توليد السلسلة وتمكن من حساب جداء النقاط التناظري الموازي المطلوب للانتباه الذاتي. غير أن دوائر خلايا الكسب التناظرية تقدم عدم مثالية وقيود تمنع الخريطة المباشرة للنماذج المدربة مسبقاً. لتجنب هذه المشكلة، صممنا خوارزمية تهيئة تحقق أداءً في معالجة النصوص مماثل لـ GPT-2 دون الحاجة إلى تدريب من البداية. تقلل بنيتنا زمن تأخير الانتباه واستهلاك الطاقة بما يصل إلى مرتين وأربعة مراتب على التوالي مقارنة بوحدات معالجة الرسومات، مما يمثل خطوة كبيرة نحو محولات توليدية فائقة السرعة ومنخفضة الطاقة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Nathan Leroux
Paul Manea
Chirag Sudarshan
Forschungszentrum Jülich
Building similarity graph...
Analyzing shared references across papers
Loading...
درس لورو وآخرون (الأربعاء) هذا السؤال.
www.synapsesocial.com/papers/69730ef2c8125b09b0d1ed33 — DOI: https://doi.org/10.34734/fzj-2026-00225
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: