Treinamento Denso, Inferência Esparsa: Repensando o Treinamento de Modelos de Linguagem Mixture-of-Experts | Synapse