Die sprachverbessernde Erhaltung räumlicher Hinweise ist entscheidend für die gleichzeitige Erreichung von Verständlichkeit und dem Eindruck des "Dabeiseins" in sprecherdominanten Ambisonics-Audio-Kommunikationssystemen. Datengetriebene Sprachverbesserung für Ambisonics Ein-Ausgangssysteme steht vor zwei zentralen Herausforderungen. Erstens führt die Gestaltung des Zielsignals für die Nachhallformung, ausschließlich aus einer zeitlichen Perspektive wie bei Ein-Kanal-Szenarien, oft zu einer Verschlechterung der räumlichen Wahrnehmung. Zweitens wurde die Eignung verschiedener Filtermatrix-Formulierungen für unterschiedliche Zielsignale bisher nicht systematisch untersucht. Zur Gestaltung des Zielsignals formulieren wir dies als ein Problem der Impulsantwortformung im Ambisonics-Raum und schlagen eine räumliche Formung basierend auf maximaler Direktivität sowie eine Variante vor, die die omnidirektionale Komponente verlustfrei passieren lässt. Zur Schätzung dieser Zielsignale etablieren wir einen neuronalen Filterungsrahmen, der sowohl den sphärischen Harmonischen-Domäne als auch die Ebene-Wellen-Domäne umfasst, mit drei Parametrisierungen der Filtermatrix: Maske, Beamform-and-Project und uneingeschränkte Matrix. Die Experimente zeigen, dass die vorgeschlagene räumlich-zeitliche Nachhallformung einen natürlicheren räumlichen Höreindruck des Zielsignals erzeugt und die räumliche Entmaskierung weiter verbessert, wobei die Leistung der neuronalen Filterung primär von der Eignung des Rangs der Filtermatrix für die räumlichen Kovarianzmatrizen der Signale abhängt und weniger von der räumlichen Transformation.
Building similarity graph...
Analyzing shared references across papers
Loading...
Shiqi Wang
Hongbing Qiu
Guilin University of Technology
Xiyu Song
Guilin University of Technology
The Journal of the Acoustical Society of America
Guilin University of Electronic Technology
Guilin University of Technology
Building similarity graph...
Analyzing shared references across papers
Loading...
Wang et al. (Wed,) untersuchten diese Fragestellung.
synapsesocial.com/papers/69d896566c1944d70ce07bdf — DOI: https://doi.org/10.1121/10.0043334