What type of study is this?

This is a Experimental Study study.

October 5, 2025Open Access

ACON: Otimizando a Compressão de Contexto para Agentes LLM de Longo Horizonte

Key Points

ACON comprime de forma ótima as observações do ambiente e históricos de interação, aumentando a eficiência em tarefas de longo horizonte.
Experimentos mostram uma redução do uso de memória de 26-54% enquanto preservam o desempenho da tarefa em vários benchmarks.
A metodologia envolve analisar falhas na compressão para atualizar diretrizes, conduzindo a resultados aprimorados para LLMs capazes.
Esta abordagem facilita o aprimoramento de modelos de linguagem menores como agentes de longo horizonte, alcançando até 46% de melhoria no desempenho.

Abstract

Modelos de linguagem grandes (LLMs) estão sendo cada vez mais utilizados como agentes em ambientes dinâmicos do mundo real, onde o sucesso requer tanto raciocínio quanto uso eficaz de ferramentas. Um desafio central para tarefas agenticas é o crescimento do comprimento do contexto, já que os agentes devem acumular longos históricos de ações e observações. Essa expansão aumenta os custos e reduz a eficiência em tarefas de longo horizonte, apesar de trabalhos anteriores sobre compressão de contexto terem se concentrado principalmente em tarefas de passo único ou aplicações restritas. Introduzimos a Otimização de Contexto de Agente (ACON), uma estrutura unificada que comprime de forma ótima tanto as observações do ambiente quanto os históricos de interação em condensados concisos porém informativos. O ACON aproveita a otimização de diretrizes de compressão no espaço da linguagem natural: dadas trajetórias pareadas onde o contexto completo tem sucesso, mas o contexto comprimido falha, LLMs capazes analisam as causas da falha, e a diretriz de compressão é atualizada de acordo. Além disso, propomos destilar o compressor LLM otimizado em modelos menores para reduzir a sobrecarga do módulo adicional. Experimentos no AppWorld, OfficeBench e Multi-objective QA mostram que o ACON reduz o uso de memória em 26-54% (tokens de pico) enquanto preserva amplamente o desempenho da tarefa, mantém mais de 95% da acurácia quando destilado em compressores menores, e melhora modelos de linguagem menores como agentes de longo horizonte com até 46% de melhoria de desempenho.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Minki Kang

Weining Chen

Donglin Han

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

ACON: Otimizando a Compressão de Contexto para Agentes LLM de Longo Horizonte

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider