유해성 감소를 위한 언어 모델 레드 팀팅: 방법, 확장 행동, 그리고 배운 교훈 | Synapse