SciEval: 과학 연구를 위한 다중 수준 대규모 언어 모델 평가 벤치마크 | Synapse