Nutzung hierarchischer Aufmerksamkeit und dynamischer Fusionsmechanismen für die multimodale Sprachanerkennung von Emotionen | Synapse