VideoAgent: Langform-Videoverstehen mit großem Sprachmodell als Agent | Synapse