CuMo: Skalierung multimodaler LLM mit Co-Upcycled Mixture-of-Experts | Synapse