SciEx: تقييم النماذج اللغوية الكبيرة في الامتحانات العلمية بتصحيح خبراء بشريين وتصحيح آلي | Synapse