CoVAR: Co-generación de Video y Acción para Manipulación Robótica mediante Difusión Multimodal | Synapse