인간과 다중모달 대형 언어 모델(MLLMs) 간의 시각 인지 격차란 무엇인가? | Synapse