VL-ICL Bench: El diablo está en los detalles del benchmarking del aprendizaje multimodal en contexto | Synapse