AquilaMoE : Formation efficace des modèles MoE avec des stratégies de montée en puissance et de mise à l'échelle horizontale | Synapse