What question did this study set out to answer?

目標は、基盤となるモデルを変更せずにAIエージェントが継続的にコンテキストを洗練できるフレームワークを開発することです。

March 18, 2026Open Access

自己進化型エージェントに向けて：継続的コンテキスト洗練のための二重過程フレームワーク

Key Points

目標は、基盤となるモデルを変更せずにAIエージェントが継続的にコンテキストを洗練できるフレームワークを開発することです。
相互作用エピソードのためのDual-Process Agent（DPA）フレームワークを導入しました。
高速のSystem 1を用いて迅速な応答を行い、低速のSystem 2で反省を行いました。
劣化を防ぐため、統計情報を伴う箇条書き形式の記憶エントリを維持しました。
有用でない記憶更新を除外する管理者ゲートを採用しました。
6つの多様なベンチマークでパフォーマンス評価の実験を行いました。
DPAはバニラプロンプティングや競合ベースラインを一貫して上回りました。
複数の推論および知識集約型タスクで最良の全体性能を達成しました。
AIとの対話における効果的な継続的コンテキスト洗練を示しました。

Abstract

大規模言語モデル（LLM）は対話型AIシステムに不可欠となっていますが、展開後は基本的に静的であり、相互作用のフィードバックからパラメータを更新できず、長期間の対話の中で同じ間違いを繰り返すことがあります。私たちは、凍結されたモデルバックボーンを変更せずに学習を可能にする継続的コンテキスト洗練のフレームワークであるDual-Process Agent（DPA）を提案します。認知科学の二重過程理論に着想を得て、DPAは各相互作用エピソードを二つの補完的プロセスに分解します：明示的な長期記憶からコンパクトで関連性の高いコンテキストを取得し応答を生成する高速のSystem 1と、結果を反映し厳選された更新を記憶に書き戻す低速のSystem 2です。長期の相互作用における記憶劣化を防ぐため、DPAは効用統計を持つ箇条書き形式の記憶エントリを維持し、一般的で冗長または矛盾した挿入を除外する保守的な管理者ゲートを採用しています。6つの多様なベンチマークでの実験は、DPAがGPT-5.1およびLlama-3.1-8Bバックボーンの両方でバニラプロンプティングや競合するベースラインを一貫して上回り、複数の推論および知識集約型タスクで最良の全体性能を達成することを示しています。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Liangyu Teng

Wei Ni

Liang Song

Journals

Electronics

Actions

Institutions

Fudan University

China State Construction Engineering (China)

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

自己進化型エージェントに向けて：継続的コンテキスト洗練のための二重過程フレームワーク

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

Institutions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider