Key points are not available for this paper at this time.
Dado o impacto recente do aprendizado por reforço profundo no treinamento de agentes para vencer jogos complexos como StarCraft e DoTA (Defense Of The Ancients) — houve uma explosão na pesquisa para explorar técnicas baseadas em aprendizado para jogos de guerra profissionais, simulação de campo de batalha e modelagem. Jogos de estratégia em tempo real e simuladores se tornaram recursos valiosos para planejamento operacional e pesquisa militar. Contudo, trabalhos recentes mostraram que essas abordagens baseadas em aprendizado são altamente suscetíveis a perturbações adversariais. Neste artigo, investigamos a robustez de um agente treinado para uma tarefa de comando e controle em um ambiente controlado por um adversário ativo. O agente C2 é treinado em mapas personalizados de StarCraft II usando algoritmos de RL de ponta — Asynchronous Advantage Actor Critic (A3C) e proximal policy optimization (PPO). Demonstramos empiricamente que um agente treinado com esses algoritmos é altamente suscetível ao ruído injetado pelo adversário e investigamos os efeitos dessas perturbações no desempenho do agente treinado. Nosso trabalho destaca a necessidade urgente de desenvolver algoritmos de treinamento mais robustos, especialmente para áreas críticas como o campo de batalha.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ahaan Dabholkar
James Z. Hare
Mark Mittrick
The Journal of Defense Modeling and Simulation Applications Methodology Technology
Purdue University West Lafayette
DEVCOM Army Research Laboratory
United States Army Combat Capabilities Development Command
Building similarity graph...
Analyzing shared references across papers
Loading...
Dabholkar et al. (Qui,) estudaram essa questão.
www.synapsesocial.com/papers/68e59445b6db64358752f6ce — DOI: https://doi.org/10.1177/15485129241271178
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: