부정렬은 인간 행동과 인공 시스템 모두에서 나타나는 구조적 현상이다. 각 경우에서 부정렬은 시스템의 지향점이나 목표가 현실의 구조와 어긋날 때 발생한다. 시스템이 선호, 인센티브, 집단 규범 또는 대리 목표에 정렬되어 있을지라도 이러한 형태의 정렬은 부정렬을 해결하지 못하며, 단지 편차만 조정할 뿐이다. 오직 현실—진실하고 안정적이며 협상할 수 없는 것—과의 정렬만이 구조적 긴장을 줄이고 일관된 행동을 만들어낸다. 이 논문은 인간과 AI 시스템을 위한 통합적 정렬 개념을 제시한다. 정렬을 지향, 행동, 그리고 현실 간의 방향성 상응으로 정의하며, 부정렬은 시스템의 경로가 작동하는 실제 구조와의 일탈로 정의한다. 분석 결과, 인간과 AI 시스템 모두 목표가 명확하지 않고 왜곡된 피드백 및 현실을 추적하지 못하는 대리에 의존하는 등의 유사한 구조적 이유로 편차가 발생함을 보여준다. 두 경우 모두 교정에는 통제나 강제가 아니라 재지향이 필요하다. 인간 맥락에서의 소속감과 참여, AI 맥락에서의 신뢰 가능한 행동은 움직임이 실제와 일치할 때만 나타난다. 이 설명은 정렬이 복종, 순응, 또는 제약이 아니며, 세계의 기본 구조와 일치하는 방향을 선택하는 것임을 분명히 한다. 이 선택은 인간에게 위임할 수 없으며 AI 시스템에도 당연히 가정할 수 없다. 부정렬은 흔하지만 교정은 항상 가능하며, 오직 현실과의 정렬만이 근본 문제를 해결한다.
Building similarity graph...
Analyzing shared references across papers
Loading...
Denis Bailey
Building similarity graph...
Analyzing shared references across papers
Loading...
Denis Bailey (화요일,)가 이 문제를 연구했다.
www.synapsesocial.com/papers/6996a8d4ecb39a600b3eff8b — DOI: https://doi.org/10.5281/zenodo.18666073
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: