MG-LLaVA: Hacia la sintonización de instrucciones visuales de múltiples granularidades | Synapse