Key points are not available for this paper at this time.
تتصدر المحولات مجال معالجة اللغة الطبيعية، حيث تمثل ابتكارًا هامًا في التعلم العميق. من أجل استدلال نموذج عالي الأداء، يعتبر تحسين وحدة الانتباه التي تستهلك وقتًا طويلًا أمرًا بالغ الأهمية. نظرًا لأعباء العمل المصفوية ذات الشكل غير المنتظم وأنماط الوصول المعقدة للبيانات، فإن عامل الانتباه يكون محدودًا بعرض النطاق الترددي للذاكرة. تستفيد الأعمال الحالية من دمج النوى لتقليل عبء الوصول إلى الذاكرة، مما يؤدي إلى تحسينات واعدة في الأداء. مع ذلك، تركز هذه الجهود بشكل أساسي على معمارية GPU أو X86، مما يترك وحدات المعالجة المتعددة النوى ARM، الشائعة في أنظمة الحوسبة عالية الأداء الناشئة، غير مستكشفة بشكل كافٍ. نقدم MEATTEN، وهي خطة دمج الانتباه الفعّالة في استهلاك الذاكرة ونهج التجميع لاستغلال وحدات المعالجة المتعددة النوى ARM بفعالية. تعتمد على نوى ميكرو مدمجة وتخطيط بيانات جديد مناسب لتوجيه SIMD المتجه. يُستخدم نموذج تحليلي لتوجيه تعديل الحلقات، والتقسيم، والتوازي المجمع وفقًا لهندسة الذاكرة الهرمية على الرقاقة وتوصيف عبء العمل. نطبق MEATTEN على ثلاثة أنوية متقدمة من ARM ضد المكتبات والمترجمات الحديثة. تظهر النتائج التجريبية أن منهجنا يتفوق باستمرار على الأساليب السابقة عبر سيناريوهات وتطبيقات متعددة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xiao Fu
Weiling Yang
Dezun Dong
National University of Defense Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
درس فوه وزملاؤه (الخميس،) هذا السؤال.
www.synapsesocial.com/papers/68e67aa1b6db643587604fe6 — DOI: https://doi.org/10.1145/3650200.3656620
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: