Key points are not available for this paper at this time.
In diesem Artikel wurden verschiedene Methodologien von akustischen und Sprachmodellen sowie Etikettierungsmethoden für die automatische Spracherkennung in gesprochenen Dialogen von Notrufzentralen untersucht und vergleichend analysiert. Aufgrund der Tatsache, dass Dialogsprache in Callcentern einen spezifischen Kontext sowie eine geräuschvolle, emotionale Umgebung aufweist, zeigen verfügbare Spracherkennungssysteme eine schlechte Leistung. Daher wurden zur genauen Erkennung von Dialogäußerungen die Hauptmodule von Spracherkennungssystemen — Sprachmodelle und akustische Trainingsmethodologien — sowie symmetrische Datenetikettierungsansätze untersucht und analysiert. Um ein effektives akustisches Modell für Dialogdaten zu finden, wurden verschiedene Typen von Gaussian Mixture Model/Hidden Markov Model (GMM/HMM) und Deep Neural Network/Hidden Markov Model (DNN/HMM) Methodologien trainiert und verglichen. Zusätzlich wurden effektive Sprachmodelle für Dialogsysteme basierend auf extrinsischen und intrinsischen Methoden definiert. Schließlich wurden unsere vorgeschlagenen Etikettierungsansätze mit Rechtschreibkorrektur mit gängigen Etikettierungsmethoden verglichen, was zu einer deutlichen Überlegenheit dieser Methoden führte. Basierend auf den Ergebnissen der Experimente stellten wir fest, dass DNN/HMM als akustisches Modell, Trigramm mit Kneser–Ney-Abschwächung für ein Sprachmodell und die Verwendung von Rechtschreibkorrektur vor den Trainingsdaten als Etikettierungsmethode effektive Konfigurationen für die Dialogspracherkennung in Notrufzentralen darstellen. Es ist zu beachten, dass diese Forschung mit zwei unterschiedlichen Datensätzen durchgeführt wurde, die aus Notrufen gesammelt wurden: dem Dialogdatensatz (27 h), der die Sprache der Anrufagenten enthält, und dem Zusammenfassungsdatensatz (53 h), der gesprochene Zusammenfassungen dieser Dialoge zu Notfällen beinhaltet. Obwohl die Sprache, die aus der Notrufzentrale stammt, Aserbaidschanisch ist, welches zur türkischen Sprachgruppe gehört, sind unsere Ansätze nicht eng an spezifische Sprachmerkmale gebunden. Daher wird erwartet, dass die vorgeschlagenen Ansätze auch auf andere Sprachen derselben Gruppe angewendet werden können.
Building similarity graph...
Analyzing shared references across papers
Loading...
Alakbar Valizada
Natavan Akhundova
Samir Rustamov
Symmetry
ADA University
Azerbaijan Technical University
Azerbaijan Scientific-Research & Design-Prospecting Power Engineering Institute
Building similarity graph...
Analyzing shared references across papers
Loading...
Valizada et al. (Fr.,) haben diese Fragestellung untersucht.
www.synapsesocial.com/papers/6a0dec62cae7912d2fa56803 — DOI: https://doi.org/10.3390/sym13040634