What type of study is this?

This is a Quantitative Study study (also classified as: Experimental Study).

October 10, 2025Open Access

Engenharia de Contexto Agentivo: Contextos Evolutivos para Modelos de Linguagem Autoaperfeiçoados

Key Points

ACE melhora a adaptabilidade, aumentando significativamente o desempenho de agentes em 10,6% e tarefas financeiras em 8,6%.
A metodologia utiliza contextos evolutivos para prevenir o colapso de contexto, garantindo a preservação do conhecimento detalhado.
Testes comparativos mostram a eficácia do ACE tanto em contextos offline quanto online, superando linhas de base robustas.
Essa abordagem suporta modelos escaláveis e eficientes com baixo overhead, permitindo necessidades reduzidas de supervisão rotulada.

Abstract

Aplicações de grandes modelos de linguagem (LLM), como agentes e raciocínio específico de domínio, dependem cada vez mais da adaptação de contexto — modificando entradas com instruções, estratégias ou evidências, em vez de atualizações de pesos. Abordagens anteriores melhoram a usabilidade, mas frequentemente sofrem de viés de brevidade, que elimina insights do domínio em resumos concisos, e de colapso de contexto, onde a reescrita iterativa erosiona detalhes ao longo do tempo. Com base na memória adaptativa introduzida pelo Dynamic Cheatsheet, apresentamos o ACE (Agentic Context Engineering), uma estrutura que trata contextos como livros de jogo evolutivos que acumulam, refinam e organizam estratégias por meio de um processo modular de geração, reflexão e curadoria. O ACE previne o colapso com atualizações estruturadas e incrementais que preservam conhecimento detalhado e escalam com modelos de contexto longo. Em benchmarks de agentes e domínios específicos, o ACE otimiza contextos tanto offline (por exemplo, prompts do sistema) quanto online (por exemplo, memória do agente), superando consistentemente linhas de base fortes: +10,6% em agentes e +8,6% em finanças, ao mesmo tempo que reduz significativamente a latência de adaptação e o custo de implantação. Notavelmente, o ACE pôde se adaptar efetivamente sem supervisão rotulada, aproveitando feedback natural de execução. No leaderboard AppWorld, o ACE iguala o agente de produção classificado em primeiro lugar na média geral e o supera na divisão de teste-desafio mais difícil, apesar de usar um modelo open-source menor. Esses resultados mostram que contextos compreensivos e evolutivos possibilitam sistemas LLM escaláveis, eficientes e autoaperfeiçoados com baixo overhead.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Qizheng Zhang

Changran Hu

Shubhangi Upasani

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Engenharia de Contexto Agentivo: Contextos Evolutivos para Modelos de Linguagem Autoaperfeiçoados

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider