What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 10, 2025Open Access

エージェンティック・コンテキスト・エンジニアリング：自己改善型言語モデルのための進化するコンテキスト

Key Points

ACEは適応性を向上させ、エージェント性能を10.6%、金融タスクを8.6%大幅に改善します。
本手法は進化するコンテキストを活用し、コンテキスト崩壊を防ぎ詳細な知識を維持します。
ベンチマークテストで、ACEはオフラインおよびオンライン両方のコンテキストで有効性を示し、強力なベースラインを凌駕します。
このアプローチはスケーラブルで効率的なモデルを低オーバーヘッドかつ少ないラベル付き監督でサポートします。

Abstract

エージェントや特定領域の推論などの大規模言語モデル（LLM）アプリケーションは、重みの更新ではなく、指示、戦略、証拠によって入力を修正するコンテキスト適応にますます依存しています。従来のアプローチは使いやすさを改善しますが、簡潔な要約のために領域の知見が失われるブレビティバイアスや、反復的な書き換えで詳細が時間とともに失われるコンテキスト崩壊に悩まされることが多いです。Dynamic Cheatsheetで導入された適応型メモリを基盤に、我々はACE（Agentic Context Engineering）を提案します。これは生成・反省・キュレーションのモジュール式プロセスを通じて、戦略を蓄積、洗練、整理する進化するプレイブックとしてコンテキストを扱うフレームワークです。ACEは構造化された段階的更新により、詳細な知識を保持しながら崩壊を防ぎ、長文コンテキストモデルにスケール可能です。エージェント及び特定領域のベンチマークで、ACEはオフライン（例：システムプロンプト）およびオンライン（例：エージェントメモリ）両方のコンテキストを最適化し、強力なベースラインを一貫して上回りました：エージェントで+10.6%、金融分野で+8.6%の向上を示し、適応遅延と展開コストも大幅に削減しました。特筆すべきは、ACEはラベル付き監督なしでも効果的に適応でき、自然な実行フィードバックを活用している点です。AppWorldリーダーボードでは、ACEは総合平均で最高ランクの実運用エージェントと同等の成績を示し、より難易度の高いテストチャレンジセグメントではそれを上回りました。これらの結果は、包括的で進化するコンテキストが、低オーバーヘッドでスケーラブルかつ効率的な自己改善型LLMシステムの実現を可能にすることを示しています。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Qizheng Zhang

Changran Hu

Shubhangi Upasani

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

エージェンティック・コンテキスト・エンジニアリング：自己改善型言語モデルのための進化するコンテキスト

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider