Évaluation des chatbots d'IA générative pour les données d'évaluation à grande échelle : comparaison entre LLM en tant que juge et évaluations humaines | Synapse