CMA-MAPPO: Integrando a Estratégia de Evolução por Adaptação da Matriz de Covariância com a Otimização Proximal de Políticas Multi-Agente para uma exploração aprimorada em ambientes de recompensas escassas | Synapse
March 3, 2026
CMA-MAPPO: Integrando a Estratégia de Evolução por Adaptação da Matrizes de Covariância com a Otimização da Política Proximal Multi-Agente para uma exploração aprimorada em ambientes de recompensas escassas.
Key Points
Uma exploração aprimorada em ambientes de recompensas escassas foi alcançada através do método CMA-MAPPO.
Evidências-chave mostram melhora significativa nas métricas de desempenho sob configurações específicas.
O modelo teórico integra adaptação da matriz de covariância e otimização de políticas proximais multi-agente para um aprendizado eficaz.
Esse novo método pode possibilitar um melhor desempenho em cenários complexos multi-agente; no entanto, validação adicional é necessária.