CMA-MAPPO: Integrando a Estratégia de Evolução por Adaptação da Matriz de Covariância com a Otimização Proximal de Políticas Multi-Agente para uma exploração aprimorada em ambientes de recompensas escassas | Synapse