학습된 비마코프 안전 제약 조건을 이용한 안전 강화 학습 | Synapse