April 9, 2021Open Access

Entwicklung von Spracherkennungssystemen in Notrufzentralen

Key Points

Key points are not available for this paper at this time.

Abstract

In diesem Artikel wurden verschiedene Methodologien von akustischen und Sprachmodellen sowie Etikettierungsmethoden für die automatische Spracherkennung in gesprochenen Dialogen von Notrufzentralen untersucht und vergleichend analysiert. Aufgrund der Tatsache, dass Dialogsprache in Callcentern einen spezifischen Kontext sowie eine geräuschvolle, emotionale Umgebung aufweist, zeigen verfügbare Spracherkennungssysteme eine schlechte Leistung. Daher wurden zur genauen Erkennung von Dialogäußerungen die Hauptmodule von Spracherkennungssystemen — Sprachmodelle und akustische Trainingsmethodologien — sowie symmetrische Datenetikettierungsansätze untersucht und analysiert. Um ein effektives akustisches Modell für Dialogdaten zu finden, wurden verschiedene Typen von Gaussian Mixture Model/Hidden Markov Model (GMM/HMM) und Deep Neural Network/Hidden Markov Model (DNN/HMM) Methodologien trainiert und verglichen. Zusätzlich wurden effektive Sprachmodelle für Dialogsysteme basierend auf extrinsischen und intrinsischen Methoden definiert. Schließlich wurden unsere vorgeschlagenen Etikettierungsansätze mit Rechtschreibkorrektur mit gängigen Etikettierungsmethoden verglichen, was zu einer deutlichen Überlegenheit dieser Methoden führte. Basierend auf den Ergebnissen der Experimente stellten wir fest, dass DNN/HMM als akustisches Modell, Trigramm mit Kneser–Ney-Abschwächung für ein Sprachmodell und die Verwendung von Rechtschreibkorrektur vor den Trainingsdaten als Etikettierungsmethode effektive Konfigurationen für die Dialogspracherkennung in Notrufzentralen darstellen. Es ist zu beachten, dass diese Forschung mit zwei unterschiedlichen Datensätzen durchgeführt wurde, die aus Notrufen gesammelt wurden: dem Dialogdatensatz (27 h), der die Sprache der Anrufagenten enthält, und dem Zusammenfassungsdatensatz (53 h), der gesprochene Zusammenfassungen dieser Dialoge zu Notfällen beinhaltet. Obwohl die Sprache, die aus der Notrufzentrale stammt, Aserbaidschanisch ist, welches zur türkischen Sprachgruppe gehört, sind unsere Ansätze nicht eng an spezifische Sprachmerkmale gebunden. Daher wird erwartet, dass die vorgeschlagenen Ansätze auch auf andere Sprachen derselben Gruppe angewendet werden können.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Alakbar Valizada

Natavan Akhundova

Samir Rustamov

Journals

Symmetry

Actions

Institutions

ADA University

Azerbaijan Technical University

Azerbaijan Scientific-Research & Design-Prospecting Power Engineering Institute

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Entwicklung von Spracherkennungssystemen in Notrufzentralen

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study