What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 10, 2025Open Access

Agentic Context Engineering: Entwicklung von Kontexten für sich selbst verbessernde Sprachmodelle

Key Points

ACE verbessert die Anpassungsfähigkeit und steigert die Agentenleistung um 10,6 % sowie Finanzaufgaben um 8,6 %.
Die Methodik nutzt sich entwickelnde Kontexte, um Kontextkollaps zu verhindern und die Erhaltung detaillierten Wissens zu gewährleisten.
Tests mit Benchmarks belegen die Wirksamkeit von ACE sowohl in Offline- als auch in Online-Kontexten und übertreffen starke Baselines.
Dieser Ansatz unterstützt skalierbare, effiziente Modelle mit geringem Overhead und geringem Bedarf an gelabelter Überwachung.

Abstract

Große Sprachmodell-Anwendungen (LLM) wie Agenten und domänenspezifisches Schließen basieren zunehmend auf Kontextanpassung – der Modifikation von Eingaben durch Anweisungen, Strategien oder Beweise statt durch Gewichtsupdates. Frühere Ansätze verbessern die Nutzbarkeit, leiden jedoch oft an Kürzungs-Bias, der domänenspezifische Erkenntnisse zugunsten knapper Zusammenfassungen vernachlässigt, sowie am Kontext-Kollaps, bei dem iterative Umschreibungen Details im Laufe der Zeit verdrängen. Aufbauend auf dem adaptiven Gedächtnis, das von Dynamic Cheatsheet eingeführt wurde, stellen wir ACE (Agentic Context Engineering) vor, ein Framework, das Kontexte als sich entwickelnde Spielbücher behandelt, welche Strategien durch einen modularen Prozess aus Generierung, Reflexion und Kuratierung akkumulieren, verfeinern und organisieren. ACE verhindert Kollaps durch strukturierte, inkrementelle Updates, die detailliertes Wissen bewahren und mit Langzeit-Kontext-Modellen skalieren. In Agenten- und domänenspezifischen Benchmark-Tests optimiert ACE Kontexte sowohl offline (z. B. System-Prompts) als auch online (z. B. Agenten-Gedächtnis) und übertrifft dabei konsequent starke Baselines: +10,6 % bei Agenten und +8,6 % im Finanzbereich, während es gleichzeitig Anpassungslatenz und Rollout-Kosten signifikant senkt. Bemerkenswerterweise konnte ACE effektiv ohne gelabelte Überwachung angepasst werden, indem es stattdessen natürliches Ausführungsfeedback nutzte. Auf der AppWorld-Rangliste erreicht ACE den topbewerteten Produktionsagenten beim Gesamtdurchschnitt und übertrifft ihn im stärkeren Test-Challenge-Split, obwohl es ein kleineres Open-Source-Modell verwendet. Diese Ergebnisse zeigen, dass umfassende, sich entwickelnde Kontexte skalierbare, effiziente und sich selbst verbessernde LLM-Systeme mit geringem Aufwand ermöglichen.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Qizheng Zhang

Changran Hu

Shubhangi Upasani

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Agentic Context Engineering: Entwicklung von Kontexten für sich selbst verbessernde Sprachmodelle

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider