Key points are not available for this paper at this time.
حقق الـTransformer ومشتقاته نجاحًا في مهام متنوعة عبر رؤية الحاسوب، ومعالجة اللغة الطبيعية، ومعالجة الكلام. ولتقليل تعقيد العمليات الحسابية داخل آلية الانتباه الذاتي متعدد الرؤوس في Transformer، تم اقتراح نماذج الفضاء الحركي الانتقائية (أي مامبا) كبديل. أظهرت مامبا فعاليتها في مهام معالجة اللغة الطبيعية ورؤية الحاسوب، ولكن تم التحقيق نادرًا في تفوقها في معالجة إشارات الكلام. تستكشف هذه الورقة حلولًا لتطبيق مامبا على معالجة الكلام باستخدام مهمتين نموذجيتين لمعالجة الكلام: التعرف على الكلام، الذي يتطلب معلومات دلالية ومتسلسلة، وتحسين الكلام، الذي يركز بشكل أساسي على الأنماط التسلسلية. تُظهر النتائج تفوق مامبا ثنائية الاتجاه (BiMamba) في معالجة الكلام مقارنة بمامبا العادية. علاوة على ذلك، تُبيّن التجارب فعالية BiMamba كبديل لوحدة الانتباه الذاتي في Transformer ومشتقاته، لا سيما للمهمة التي تعتمد على الوعي الدلالي. ثم يتم تلخيص التقنيات الحاسمة لنقل مامبا إلى الكلام في دراسات الحذف وقسم المناقشة لتقديم رؤى للبحوث المستقبلية.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xiangyu Zhang
Qiquan Zhang
Hexin Liu
Building similarity graph...
Analyzing shared references across papers
Loading...
درس Zhang وآخرون (الثلاثاء) هذا السؤال.
www.synapsesocial.com/papers/68e6910cb6db6435876180d1 — DOI: https://doi.org/10.48550/arxiv.2405.12609
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: