March 1, 1989

التعرف على الأصوات باستخدام الشبكات العصبية ذات التأخير الزمني

Key Points

Key points are not available for this paper at this time.

Abstract

يقدم المؤلفون نهج الشبكة العصبية ذات التأخير الزمني (TDNN) للتعرف على الأصوات، والذي يتميز بخاصيتين هامتين: (1) باستخدام ترتيب ثلاثي الطبقات من وحدات الحوسبة البسيطة، يمكن بناء تسلسل هرمي يسمح بتشكيل سطوح قرار غير خطية تعسفية، والتي تتعلمها TDNN تلقائيًا باستخدام انتقال الخطأ العكسي؛ و(2) يتيح ترتيب التأخير الزمني للشبكة اكتشاف الميزات الصوتية والفوتيتية والعلاقات الزمنية بينها بشكل مستقل عن الموقع الزمني، وبالتالي لا تتأثر بالتحولات الزمنية في المدخلات. كمهام للتعرف، تم اختيار التعرف المعتمد على المتحدث للأصوات B وD وG في سياقات صوتية متغيرة. للمقارنة، تم تدريب عدة نماذج ماركوف مخفية متقطعة (HMM) لأداء نفس المهمة. أظهر تقييم الأداء على 1946 رمز اختبار من ثلاثة متحدثين أن TDNN يحقق معدل تعرف بنسبة 98.5% صحيح، في حين أن أفضل معدل حصلت عليه نماذج HMM كان 93.7% فقط.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Alexander Waibel

Toshiyuki Hanazawa

Geoffrey E. Hinton

Journals

IEEE Transactions on Acoustics Speech and Signal Processing

Actions

Institutions

University of Toronto

Carnegie Mellon University

Canadian Institute for Advanced Research

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

التعرف على الأصوات باستخدام الشبكات العصبية ذات التأخير الزمني

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider