융합 전에 정렬: 모멘텀 증류를 이용한 비전 및 언어 표현 학습 | Synapse