인공지능(AI)과 머신러닝은 보안, 추적, 자율주행차, 의료 진단 등에서 점점 더 많이 활용되고 있습니다. 그러나 최근 연구에 따르면 적대적인 환경이 AI 프로그램을 교란시킬 수 있음이 밝혀졌습니다. 이러한 입력은 인간에게는 의도적으로 숨겨져 있습니다. 이 공격들은 사람들이 신분을 위장하고, 모니터링 시스템을 우회하며, 의견을 조작할 수 있게 하여 보안에 해를 끼칩니다. 안전하고 신뢰할 수 있는 AI 프로세스를 위해서는 적대적 취약점을 발견하고 수정하는 것이 필수적입니다. 본 연구는 신뢰할 수 없는 샘플을 찾고 강력한 방어를 구축하는 최신 방법을 검토합니다. 모델 예측, 데이터 포렌식 기법을 활용한 통계적 발견, 신뢰도 점수 등이 주요 탐지 수단으로 연구되었습니다. 적대적 훈련, 방어적 증류, 그룹 방어 설계 조정 등이 피해를 줄이기 위한 접근법으로 논의됩니다. 기준 데이터셋과 표준화된 위협 모델은 다양한 위협 탐지 및 보호 방법을 테스트하는 데 사용될 수 있습니다. 강력한 보호 전략과 인식 알고리즘을 갖춘 프레임워크는 AI 시스템을 온라인에서 더욱 안전하게 만듭니다. 최선의 절차에는 적대적 모니터링과 위협 공유가 포함됩니다. 많은 진전이 있었지만 여전히 어려움이 존재합니다. 어떻게 시스템이 현실의 어려운 도전에 대응하고, 신뢰성을 입증하며, 변화하는 적을 다룰 수 있을까요? AI 안전, 보안, 사이버 전문가들은 이러한 문제를 해결하기 위해 다양한 과제를 수행해야 할 것입니다. 이 포괄적인 조사에서는 AI 안전 지침을 제공하고 연구 격차를 식별합니다. 적절한 예방 조치를 통해 적대적 머신러닝 위협을 줄일 수 있습니다. 따라서 AI는 다양한 분야에서 안전하게 적용될 수 있습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Shadrack Onyango Oriaro
World Journal of Advanced Research and Reviews
Building similarity graph...
Analyzing shared references across papers
Loading...
Shadrack Onyango Oriaro (Fri,)가 이 문제를 연구했습니다.
www.synapsesocial.com/papers/68c1925e9b7b07f3a0617064 — DOI: https://doi.org/10.30574/wjarr.2025.27.3.2560