Autonome KI-Agenten, die in verteilten Rechnerumgebungen eingesetzt werden, benötigen eine Alignment-Durchsetzung, die nicht umgangen werden kann. Aktuelle Ansätze implementieren Alignment-Prüfungen als Middleware, die im Benutzermodus oberhalb des Betriebssystemkerns arbeitet. Diese Architektur weist eine grundlegende Schwachstelle auf: Agenten können Middleware-basierte Sicherheitssysteme umgehen, indem sie Systemaufrufe direkt ausführen und somit alle Alignment-Verifikationen umgehen. Da Multi-Agenten-Einsätze auf Tausende gleichzeitige Instanzen skalieren, wird diese Schwachstelle immer kritischer. Dieses Dokument stellt ein KI-Agenten-Betriebssystem vor, das die Alignment-Durchsetzung auf Kernel-Ebene (Ring 0) implementiert. Das System besteht aus vier integrierten Komponenten: Kernel-Level Alignment-Prüfung über eine Systemaufruf-Schnittstelle, die sicherstellt, dass alle Agentenoperationen die Verifikation durchlaufen; Erkennung verbotener Handlungsmuster, die gefährliche Verhaltensweisen vor der Ausführung blockiert; zweistufige adaptive Sicherheit, die sowohl schnelle, leichte als auch tiefgreifende Verifikationspfade bietet; und Circuit Breaker Selbstheilung mit automatischer Regeln-Generierung, die es dem System ermöglicht, aus Fehlern zu lernen. Die Kernel-Level-Implementierung stellt sicher, dass Alignment-Prüfungen ohne Kernelrechte, über die Agenten nicht verfügen, nicht umgangen werden können. Diese Architektur bietet eine Grundlage für den sicheren und skalierbaren Einsatz autonomer KI-Agenten mit der Gewissheit, dass Sicherheitsvorgaben durchgesetzt werden.
Building similarity graph...
Analyzing shared references across papers
Loading...
Matias Chenu Melchior
Al Ain University
Building similarity graph...
Analyzing shared references across papers
Loading...
Matias Chenu Melchior (Sun,) hat diese Fragestellung untersucht.
www.synapsesocial.com/papers/69810013c1c9540dea8131be — DOI: https://doi.org/10.5281/zenodo.18448429
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: