Effizientes LLM-Training und -Serving mit heterogenem Kontext-Sharding unter Attention-Heads | Synapse