What question did this study set out to answer?

本研究旨在定义保持民主治理的非主导人工智能系统的理论框架。

January 14, 2026Open Access

无权威的智能：迈向非主导人工智能系统的一般架构理论

Key Points

本研究旨在定义保持民主治理的非主导人工智能系统的理论框架。
进行了决策系统的结构分析。
开发了非主导人工智能系统的一般架构理论。
引入了规范因果完整性和解耦等概念。
识别了先进人工智能部署中的失效模式。
阐明了人工智能如何通过对不可逆记录的控制而变得危险。
强调了延迟终结性和强制质疑在人工智能系统中的重要性。
确立了可以通过设计在保持代理权的同时维持人工智能民主治理。

Abstract

现有的人工智能安全方法将风险归结为目标不一致、过度自治或超人类智能的函数。本文提出了一个不同的论点：人工智能变得危险，并非因为智能本身，而是因其对不可逆转记录终结性的控制。当人工智能输出固化为约束未来行动的具有约束力的记录，其速度超过人类质疑的能力时，支配性便在无恶意、无意图或无意识的情况下出现。基于对决策系统的结构分析，本文制定了一种基于认知与权威严格分离的非主导人工智能系统的一般架构理论。引入规范因果完整性（Normative Causal Integrity, NCI）作为中心安全不变量，识别了符号上规范持续而失去对结果因果控制的“解耦”作为先进人工智能部署的主要失效模式。所提架构通过延迟终结性、强制质疑、分布式授权和人类问责制，在设计上保持了民主治理。该框架将人工智能安全重新定位为制度和架构问题，而非对齐或能力问题，从而实现了无权威捕获或代理丧失的大规模智能增强。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

SPIROS P Kalalis

Actions

Institutions

Epic Systems (United States)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

无权威的智能：迈向非主导人工智能系统的一般架构理论

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider