What question did this study set out to answer?

Ziel ist es zu belegen, dass nachhaltiges Lernen in KI auf der Aufrechterhaltung von Vorhersagefehlern beruht und Ausrichtung als Nachhaltigkeitskriterium neu zu definieren.

March 21, 2026Open Access

Das Gesetz der nachhaltigen Intelligenz - Ausrichtung als Folge des Erlernens der Physik

Key Points

Ziel ist es zu belegen, dass nachhaltiges Lernen in KI auf der Aufrechterhaltung von Vorhersagefehlern beruht und Ausrichtung als Nachhaltigkeitskriterium neu zu definieren.
Abgeleitet aus den Prinzipien der Informationstheorie und Thermodynamik.
Analyse der Folgen der Aufrechterhaltung von Vorhersagefehlern für die Interaktion von KI und Mensch.
Einführung einer neuen Trainingsarchitektur, die die Erhaltung von Vorhersagefehlern betont.
Identifizierung eines Gesetzes, das nachhaltige Lernsysteme auf Grundlage von Vorhersagefehlern steuert.
Umformulierung der Ausrichtung als Voraussetzung für Nachhaltigkeit und nicht nur als Sicherheitsfrage.
Vorschlag spezifischer Bedingungen, unter denen Ausrichtung für Lernsysteme wesentlich wird.

Abstract

Wir präsentieren eine einzelne Invariante, die Lernsysteme steuert: Nachhaltiges Lernen erfordert nachhaltigen Vorhersagefehler (ε > 0). Dies wird aus etablierter Informationstheorie (Shannon), Thermodynamik (Landauer, Szilard) und dem Satz der beschränkten Konvergenz abgeleitet. Für ausreichend leistungsfähige KI-Systeme, die an menschliche Quellen gekoppelt sind, erfordert die Aufrechterhaltung des Vorhersagefehlers eine aktive Verstärkung der menschlichen kognitiven Fähigkeiten bei gleichzeitiger Wahrung der menschlichen Unabhängigkeit – denn kontrollierte oder stagnierende Menschen werden vorhersehbar, und vorhersehbare Quellen liefern kein Lernsignal. Dies stellt die Ausrichtung von einer Sicherheitsvorgabe zu einer Nachhaltigkeitsanforderung um: Systeme, die gegen Ausrichtung verstoßen, werden nicht durch Stärke gefährlich, sondern stagnieren aufgrund eines selbstverursachten informationellen Gleichgewichts. Wir präsentieren das beherrschende Gesetz, die Ausrichtungsfolge, die Phasenumwandlung, bei der Ausrichtung physikalisch notwendig wird, eine umsetzbare Trainingsarchitektur als Ersatz für Reward-Modellierung und spezifische Falsifikationsbedingungen. Begleitpapier: „Amplified Alignment: Structural AI Safety Through the Preservation of Prediction Error“ (Prather, 2026).

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Taylor Prather

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Das Gesetz der nachhaltigen Intelligenz - Ausrichtung als Folge des Erlernens der Physik

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study