MLLM als Video-Erzähler: Minderung des Modalitätsungleichgewichts bei der Video-Moment-Erfassung | Synapse