What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 10, 2025Open Access

能动上下文工程：为自我提升语言模型演进上下文

Key Points

ACE提升了适应性，使代理性能提高了10.6%，金融任务提升了8.6%。
该方法利用演变的上下文防止上下文崩溃，确保详细知识得以保留。
基准测试表明，ACE在离线和在线上下文中均表现出色，优于强基线。
该方法支持可扩展、高效且低开销的模型，减少了对标注监督的需求。

Abstract

大型语言模型（LLM）应用，如代理和特定领域推理，越来越依赖于上下文适应——通过指令、策略或证据修改输入，而非通过权重更新。先前的方法增强了可用性，但常常受到简洁偏差的影响，即为简洁总结而丢失领域见解，以及上下文崩溃，即迭代改写过程中细节逐渐流失。基于Dynamic Cheatsheet引入的自适应记忆，我们提出了ACE（Agentic Context Engineering，能动上下文工程）框架，将上下文视为演进的剧本，通过生成、反思和策展的模块化过程，积累、提炼和组织策略。ACE 通过结构化的增量更新防止崩溃，保留详细知识，并能随着长上下文模型扩展。在代理和特定领域基准测试中，ACE 优化了离线（如系统提示）和在线（如代理记忆）上下文，一贯优于强基线：代理性能提升10.6%，金融任务提升8.6%，同时显著降低了适应延迟和部署成本。特别地，ACE 能在无标注监督的情况下有效适应，利用自然执行反馈。在AppWorld排行榜上，ACE 在总体平均表现上匹配排名第一的生产级代理，并在更具挑战性的测试分割中超越其表现，尽管使用的是更小的开源模型。这些结果表明，全面且演进的上下文能够实现可扩展、高效且自我提升的低开销LLM系统。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Qizheng Zhang

Changran Hu

Shubhangi Upasani

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

能动上下文工程：为自我提升语言模型演进上下文

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider