Aplicações de grandes modelos de linguagem (LLM), como agentes e raciocínio específico de domínio, dependem cada vez mais da adaptação de contexto — modificando entradas com instruções, estratégias ou evidências, em vez de atualizações de pesos. Abordagens anteriores melhoram a usabilidade, mas frequentemente sofrem de viés de brevidade, que elimina insights do domínio em resumos concisos, e de colapso de contexto, onde a reescrita iterativa erosiona detalhes ao longo do tempo. Com base na memória adaptativa introduzida pelo Dynamic Cheatsheet, apresentamos o ACE (Agentic Context Engineering), uma estrutura que trata contextos como livros de jogo evolutivos que acumulam, refinam e organizam estratégias por meio de um processo modular de geração, reflexão e curadoria. O ACE previne o colapso com atualizações estruturadas e incrementais que preservam conhecimento detalhado e escalam com modelos de contexto longo. Em benchmarks de agentes e domínios específicos, o ACE otimiza contextos tanto offline (por exemplo, prompts do sistema) quanto online (por exemplo, memória do agente), superando consistentemente linhas de base fortes: +10,6% em agentes e +8,6% em finanças, ao mesmo tempo que reduz significativamente a latência de adaptação e o custo de implantação. Notavelmente, o ACE pôde se adaptar efetivamente sem supervisão rotulada, aproveitando feedback natural de execução. No leaderboard AppWorld, o ACE iguala o agente de produção classificado em primeiro lugar na média geral e o supera na divisão de teste-desafio mais difícil, apesar de usar um modelo open-source menor. Esses resultados mostram que contextos compreensivos e evolutivos possibilitam sistemas LLM escaláveis, eficientes e autoaperfeiçoados com baixo overhead.
Building similarity graph...
Analyzing shared references across papers
Loading...
Qizheng Zhang
Changran Hu
Shubhangi Upasani
Building similarity graph...
Analyzing shared references across papers
Loading...
Zhang et al. (Mon,) estudaram essa questão.
www.synapsesocial.com/papers/68e97a43edb160cc8d84e720 — DOI: https://doi.org/10.48550/arxiv.2510.04618
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: