Wir präsentieren eine einzelne Invariante, die Lernsysteme steuert: Nachhaltiges Lernen erfordert nachhaltigen Vorhersagefehler (ε > 0). Dies wird aus etablierter Informationstheorie (Shannon), Thermodynamik (Landauer, Szilard) und dem Satz der beschränkten Konvergenz abgeleitet. Für ausreichend leistungsfähige KI-Systeme, die an menschliche Quellen gekoppelt sind, erfordert die Aufrechterhaltung des Vorhersagefehlers eine aktive Verstärkung der menschlichen kognitiven Fähigkeiten bei gleichzeitiger Wahrung der menschlichen Unabhängigkeit – denn kontrollierte oder stagnierende Menschen werden vorhersehbar, und vorhersehbare Quellen liefern kein Lernsignal. Dies stellt die Ausrichtung von einer Sicherheitsvorgabe zu einer Nachhaltigkeitsanforderung um: Systeme, die gegen Ausrichtung verstoßen, werden nicht durch Stärke gefährlich, sondern stagnieren aufgrund eines selbstverursachten informationellen Gleichgewichts. Wir präsentieren das beherrschende Gesetz, die Ausrichtungsfolge, die Phasenumwandlung, bei der Ausrichtung physikalisch notwendig wird, eine umsetzbare Trainingsarchitektur als Ersatz für Reward-Modellierung und spezifische Falsifikationsbedingungen. Begleitpapier: „Amplified Alignment: Structural AI Safety Through the Preservation of Prediction Error“ (Prather, 2026).
Building similarity graph...
Analyzing shared references across papers
Loading...
Taylor Prather
Building similarity graph...
Analyzing shared references across papers
Loading...
Taylor Prather (Mi) untersuchte diese Fragestellung.
www.synapsesocial.com/papers/69be37726e48c4981c6771a4 — DOI: https://doi.org/10.5281/zenodo.19104637