Audiovisuelles Training zur verbesserten Verankerung in Video-Text-LLMs | Synapse