DeepSpeed- Inference:かつてない規模でのTransformerモデルの効率的な推論を可能にする | Synapse