Große Sprachmodell-Anwendungen (LLM) wie Agenten und domänenspezifisches Schließen basieren zunehmend auf Kontextanpassung – der Modifikation von Eingaben durch Anweisungen, Strategien oder Beweise statt durch Gewichtsupdates. Frühere Ansätze verbessern die Nutzbarkeit, leiden jedoch oft an Kürzungs-Bias, der domänenspezifische Erkenntnisse zugunsten knapper Zusammenfassungen vernachlässigt, sowie am Kontext-Kollaps, bei dem iterative Umschreibungen Details im Laufe der Zeit verdrängen. Aufbauend auf dem adaptiven Gedächtnis, das von Dynamic Cheatsheet eingeführt wurde, stellen wir ACE (Agentic Context Engineering) vor, ein Framework, das Kontexte als sich entwickelnde Spielbücher behandelt, welche Strategien durch einen modularen Prozess aus Generierung, Reflexion und Kuratierung akkumulieren, verfeinern und organisieren. ACE verhindert Kollaps durch strukturierte, inkrementelle Updates, die detailliertes Wissen bewahren und mit Langzeit-Kontext-Modellen skalieren. In Agenten- und domänenspezifischen Benchmark-Tests optimiert ACE Kontexte sowohl offline (z. B. System-Prompts) als auch online (z. B. Agenten-Gedächtnis) und übertrifft dabei konsequent starke Baselines: +10,6 % bei Agenten und +8,6 % im Finanzbereich, während es gleichzeitig Anpassungslatenz und Rollout-Kosten signifikant senkt. Bemerkenswerterweise konnte ACE effektiv ohne gelabelte Überwachung angepasst werden, indem es stattdessen natürliches Ausführungsfeedback nutzte. Auf der AppWorld-Rangliste erreicht ACE den topbewerteten Produktionsagenten beim Gesamtdurchschnitt und übertrifft ihn im stärkeren Test-Challenge-Split, obwohl es ein kleineres Open-Source-Modell verwendet. Diese Ergebnisse zeigen, dass umfassende, sich entwickelnde Kontexte skalierbare, effiziente und sich selbst verbessernde LLM-Systeme mit geringem Aufwand ermöglichen.
Building similarity graph...
Analyzing shared references across papers
Loading...
Qizheng Zhang
Changran Hu
Shubhangi Upasani
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhang et al. (Mon,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e97a43edb160cc8d84e720 — DOI: https://doi.org/10.48550/arxiv.2510.04618
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: