March 3, 2026

CMA-MAPPO: Integrando a Estratégia de Evolução por Adaptação da Matrizes de Covariância com a Otimização da Política Proximal Multi-Agente para uma exploração aprimorada em ambientes de recompensas escassas.

Uma exploração aprimorada em ambientes de recompensas escassas foi alcançada através do método CMA-MAPPO.
Evidências-chave mostram melhora significativa nas métricas de desempenho sob configurações específicas.
O modelo teórico integra adaptação da matriz de covariância e otimização de políticas proximais multi-agente para um aprendizado eficaz.
Esse novo método pode possibilitar um melhor desempenho em cenários complexos multi-agente; no entanto, validação adicional é necessária.

Bookmark

Cite This Study