What question did this study set out to answer?

تهدف الدراسة إلى تحسين كفاءة وسرعة نماذج اللغة الكبيرة من خلال بنية حوسبة مبتكرة داخل الذاكرة.

January 23, 2026Open Access

آلية الانتباه الحوسبية التناظرية داخل الذاكرة لنماذج اللغة الكبيرة السريعة وموفرة للطاقة

Key Points

تهدف الدراسة إلى تحسين كفاءة وسرعة نماذج اللغة الكبيرة من خلال بنية حوسبة مبتكرة داخل الذاكرة.
تم تطوير آلية انتباه ذاتي مخصصة باستخدام خلايا الكسب للحوسبة داخل الذاكرة.
تم تصميم خوارزمية تهيئة لتكييف النماذج الحالية مع البنية الجديدة.
تمت مقارنة أداء البنية الجديدة مع أنظمة معتمدة على وحدات معالجة الرسومات التقليدية.
تحقيق تقليل زمن تأخير الانتباه بما يصل إلى مرتبتين من الحجم.
انخفاض استهلاك الطاقة بما يصل إلى أربع مراتب من الحجم مقارنة بوحدات معالجة الرسومات.
حافظ على أداء مماثل لـ GPT-2 دون الحاجة إلى بدء التدريب من الصفر.

Abstract

تعد شبكات المحولات، المدفوعة بالانتباه الذاتي، مركزية لنماذج اللغة الكبيرة. في المحولات التوليدية، يستخدم الانتباه الذاتي ذاكرة التخزين المؤقت لتخزين إسقاطات الرموز، مما يتجنب إعادة الحساب في كل خطوة زمنية. ومع ذلك، يجب تحميل الإسقاطات المخزنة على وحدات معالجة الرسومات (GPU) إلى الذاكرة العشوائية الثابتة لكل خطوة توليد جديدة، مما يسبب تأخيرات واختناقات في الطاقة. هنا نقدم بنية حسابية مخصصة للانتباه الذاتي داخل الذاكرة تعتمد على ذواكر مشحونة جديدة تسمى خلايا الكسب، التي يمكن كتابتها بكفاءة لتخزين رموز جديدة أثناء توليد السلسلة وتمكن من حساب جداء النقاط التناظري الموازي المطلوب للانتباه الذاتي. غير أن دوائر خلايا الكسب التناظرية تقدم عدم مثالية وقيود تمنع الخريطة المباشرة للنماذج المدربة مسبقاً. لتجنب هذه المشكلة، صممنا خوارزمية تهيئة تحقق أداءً في معالجة النصوص مماثل لـ GPT-2 دون الحاجة إلى تدريب من البداية. تقلل بنيتنا زمن تأخير الانتباه واستهلاك الطاقة بما يصل إلى مرتين وأربعة مراتب على التوالي مقارنة بوحدات معالجة الرسومات، مما يمثل خطوة كبيرة نحو محولات توليدية فائقة السرعة ومنخفضة الطاقة.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Nathan Leroux

Paul Manea

Chirag Sudarshan

Actions

Institutions

Forschungszentrum Jülich

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

آلية الانتباه الحوسبية التناظرية داخل الذاكرة لنماذج اللغة الكبيرة السريعة وموفرة للطاقة

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider