October 16, 2025Open Access

AI 안전을 위한 계산적, 정보적, 물리적 기초에 관하여

Key Points

AI 안전 접근법은 계산 복잡성과 정보 이론의 한계로 인해 본질적인 장벽에 직면해 있습니다.
단순화된 자기 검증 방법조차도 계산적으로 다루기 어려운 문제(NP-완전 문제)임이 증명되었습니다.
해악과 같은 모호한 개념의 명세는 필연적으로 불완전하여 근본적인 문제를 내포합니다.
소프트웨어 의존성을 우회하는 물리적으로 강제되는 안전 한계에 대해 추론하는 새로운 프레임워크가 제안됩니다.

Abstract

현재 AI 안전 접근법은 주로 소프트웨어, 데이터 및 규칙을 통해 올바른 행동을 명시하는 데 집중합니다. 본 연구는 이러한 접근법이 단지 실용적인 한계뿐만 아니라 이론적으로 근본적인 한계에 직면해 있음을 주장합니다. 계산 복잡성, 정보 이론, 물리적 공학의 관점에서 이 패러다임의 내재적 장벽을 다층적으로 분석합니다. 진행 중인 연구에서는 의미적 자기 검증의 단순화된 형태조차도 계산적으로 다루기 어렵다는 것(NP-완전 문제)을 증명합니다. 정보 이론을 활용해 "해악"처럼 외부의 모호한 개념을 명세하는 것은 필연적으로 불완전하다는 점을 보입니다. 이러한 한계를 극복하기 위해 소프트웨어 상태와 독립적인 물리적으로 강제되는 안전 한계에 대해 추론하는 프레임워크를 개발했습니다.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

R. Michael Young (Wed,) 이 이 질문을 연구했습니다.

www.synapsesocial.com/papers/68f12bfb2107091eab27a492 — DOI: https://doi.org/10.1609/aies.v8i3.36802

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

AI 안전을 위한 계산적, 정보적, 물리적 기초에 관하여

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion