Key points are not available for this paper at this time.
يقدم المؤلفون نهج الشبكة العصبية ذات التأخير الزمني (TDNN) للتعرف على الأصوات، والذي يتميز بخاصيتين هامتين: (1) باستخدام ترتيب ثلاثي الطبقات من وحدات الحوسبة البسيطة، يمكن بناء تسلسل هرمي يسمح بتشكيل سطوح قرار غير خطية تعسفية، والتي تتعلمها TDNN تلقائيًا باستخدام انتقال الخطأ العكسي؛ و(2) يتيح ترتيب التأخير الزمني للشبكة اكتشاف الميزات الصوتية والفوتيتية والعلاقات الزمنية بينها بشكل مستقل عن الموقع الزمني، وبالتالي لا تتأثر بالتحولات الزمنية في المدخلات. كمهام للتعرف، تم اختيار التعرف المعتمد على المتحدث للأصوات B وD وG في سياقات صوتية متغيرة. للمقارنة، تم تدريب عدة نماذج ماركوف مخفية متقطعة (HMM) لأداء نفس المهمة. أظهر تقييم الأداء على 1946 رمز اختبار من ثلاثة متحدثين أن TDNN يحقق معدل تعرف بنسبة 98.5% صحيح، في حين أن أفضل معدل حصلت عليه نماذج HMM كان 93.7% فقط.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alexander Waibel
Toshiyuki Hanazawa
Geoffrey E. Hinton
IEEE Transactions on Acoustics Speech and Signal Processing
University of Toronto
Carnegie Mellon University
Canadian Institute for Advanced Research
Building similarity graph...
Analyzing shared references across papers
Loading...
درس وايبل وآخرون (الأربعاء،) هذا السؤال.
www.synapsesocial.com/papers/69e56b6dbc8f2d4e7b8dc2ec — DOI: https://doi.org/10.1109/29.21701
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: