현재 AI 안전 접근법은 주로 소프트웨어, 데이터 및 규칙을 통해 올바른 행동을 명시하는 데 집중합니다. 본 연구는 이러한 접근법이 단지 실용적인 한계뿐만 아니라 이론적으로 근본적인 한계에 직면해 있음을 주장합니다. 계산 복잡성, 정보 이론, 물리적 공학의 관점에서 이 패러다임의 내재적 장벽을 다층적으로 분석합니다. 진행 중인 연구에서는 의미적 자기 검증의 단순화된 형태조차도 계산적으로 다루기 어렵다는 것(NP-완전 문제)을 증명합니다. 정보 이론을 활용해 "해악"처럼 외부의 모호한 개념을 명세하는 것은 필연적으로 불완전하다는 점을 보입니다. 이러한 한계를 극복하기 위해 소프트웨어 상태와 독립적인 물리적으로 강제되는 안전 한계에 대해 추론하는 프레임워크를 개발했습니다.
Building similarity graph...
Analyzing shared references across papers
Loading...
R. Michael Young (Wed,) 이 이 질문을 연구했습니다.
www.synapsesocial.com/papers/68f12bfb2107091eab27a492 — DOI: https://doi.org/10.1609/aies.v8i3.36802
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:
R. Michael Young
Building similarity graph...
Analyzing shared references across papers
Loading...