효율적인 생성형 대형 언어 모델 서비스 제공을 향하여: 알고리즘에서 시스템까지의 조사 | Synapse