February 23, 2024Open Access

RL Seguro com Multi-Restrição e Supressão de Objetivos para Aplicações Críticas de Segurança

Key Points

Key points are not available for this paper at this time.

Abstract

Tarefas de aprendizado por reforço seguro com múltiplas restrições são um domínio desafiador apesar de serem muito comuns no mundo real. Para enfrentar esse desafio, propomos a Supressão de Objetivos, um método inovador que suprime adaptativamente os objetivos de maximização da recompensa da tarefa de acordo com um crítico de segurança. Testamos a Supressão de Objetivos em dois domínios de segurança multi-restrição, incluindo um domínio de direção autônoma onde qualquer comportamento incorreto pode levar a consequências desastrosas. Empiricamente, demonstramos que nosso método proposto, quando combinado com algoritmos existentes de RL seguro, pode igualar a recompensa da tarefa alcançada por nossos métodos de referência com significativamente menos violações das restrições.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Zihan Zhou

Jonathan Booher

Wei Liu

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

RL Seguro com Multi-Restrição e Supressão de Objetivos para Aplicações Críticas de Segurança

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider