Key points are not available for this paper at this time.
Sistemas de aeronaves não tripuladas (UAS) são componentes essenciais no combate aéreo do futuro. Devido à alta dinâmica e aleatoriedade das aeronaves, métodos tradicionais têm dificuldade em resolver a estratégia de controle ótima. As características do aprendizado por reforço (RL) correspondem à dificuldade deste problema. Neste artigo, construímos um ambiente de jogo de combate aéreo e treinamos o agente com deep Q-learning (DQN). Apesar de um aumento ligeiro na probabilidade de perdas, nosso método apresenta desempenho muito melhor do que outros algoritmos nas simulações. Comparado com métodos baseados em busca, como Minimax e MCTS, a política treinada por DQN pode adotar táticas específicas com uma visão de longo prazo do jogo. O resultado mostra que um grande número de simulações e características e recompensas cuidadosamente projetadas são pontos essenciais do DQN.
Building similarity graph...
Analyzing shared references across papers
Loading...
Xiaoteng Ma
Li Xia
Qianchuan Zhao
Tsinghua University
Building similarity graph...
Analyzing shared references across papers
Loading...
Ma et al. (qui,) estudaram esta questão.
www.synapsesocial.com/papers/6a0a55aaa9576e6c7db4ed92 — DOI: https://doi.org/10.1109/cac.2018.8623434
Synapse has enriched 3 closely related papers on similar clinical questions. Consider them for comparative context: