Key points are not available for this paper at this time.
لقد حقق هيكل المحول تقدمًا كبيرًا في التعلم العميق، خاصة في معالجة اللغة الطبيعية، من خلال إدارة التبعيات طويلة المدى بفعالية. ومع ذلك، مع تزايد الحاجة لفهم العلاقات المعقدة، يصبح تحسين هيكل المحول أمرًا حرجًا. تقدم هذه الورقة آلية الانتباه عبر الطبقات المتجاوزة (SLA) لتحسين نماذج المحول بتمكين الانتباه المباشر بين الطبقات غير المتجاورة. تحسن هذه الطريقة قدرة النموذج على التقاط التبعيات بين الميزات المجردة عالية المستوى والتفاصيل منخفضة المستوى. من خلال تسهيل الانتباه المباشر بين هذه المستويات المتنوعة من الميزات، تتغلب طريقتنا على القيود المفروضة على المحولات الحالية، التي غالبًا ما تعتمد على الانتباه داخل الطبقة غير الأمثل. يعمل تنفيذنا على توسيع وظيفة المحول بتمكين الاستعلامات في طبقة معينة من التفاعل مع المفاتيح والقيم من كل من الطبقة الحالية وطبقة سابقة واحدة، مما يعزز تنوع الانتباه متعدد الرؤوس دون عبء حسابي إضافي. تظهر التجارب المكثفة أن نموذج المحول المعزز لدينا يحقق أداءً متفوقًا في مهام نمذجة اللغة، مما يبرز فعالية آلية الانتباه عبر الطبقات المتجاوزة.
Building similarity graph...
Analyzing shared references across papers
Loading...
Qian Chen
Wen Wang
Qinglin Zhang
Building similarity graph...
Analyzing shared references across papers
Loading...
درس تشين وآخرون (Mon,) هذا السؤال.
www.synapsesocial.com/papers/68e64779b6db6435875d9027 — DOI: https://doi.org/10.48550/arxiv.2406.11274
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: