대형 언어 모델을 위한 효율적 추론에 관한 조사 | Synapse