Los puntos clave no están disponibles para este artículo en este momento.
En el proceso de reconocimiento y exploración con múltiples UAV, las recompensas efectivas que el entorno otorga a los agentes inteligentes son demasiado escasas, mientras que los algoritmos estándar de aprendizaje por refuerzo presentan un rendimiento deficiente en entornos con retroalimentación escasa a los agentes inteligentes, manifestándose específicamente en no explorar activamente el entorno. Se propone un algoritmo de aprendizaje por refuerzo impulsado por la curiosidad (ICM-IDQN) que combina el aprendizaje por motivación intrínseca para abordar el problema de recompensas ambientales escasas. Tras la verificación experimental, este método puede obtener más recompensas en entornos escasos, acelerar la convergencia y aumentar el desempeño en la exploración.
Building similarity graph...
Analyzing shared references across papers
Loading...
Jingyi Huang
Shuying Wu
Ziyi Yang
Northwestern Polytechnical University
Moscow Aviation Institute
Building similarity graph...
Analyzing shared references across papers
Loading...
Huang et al. (Wed,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e6a273b6db6435876259ca — DOI: https://doi.org/10.1109/ichms59971.2024.10555640
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: