What type of study is this?

This is a Experimental Study study.

October 5, 2025Open Access

ACON: Optimización de la compresión de contexto para agentes LLM de largo horizonte

Puntos clave

ACON comprime óptimamente las observaciones del entorno y las historias de interacción, mejorando la eficiencia en tareas de largo horizonte.
Los experimentos muestran una reducción en el uso de memoria entre 26-54 % mientras se preserva el rendimiento de la tarea en diversos benchmarks.
La metodología implica analizar fallos en la compresión para actualizar directrices, lo que conduce a resultados mejorados para LLMs capaces.
Este enfoque facilita la mejora de modelos de lenguaje más pequeños como agentes de largo horizonte, logrando hasta un 46 % de mejora en rendimiento.

Resumen

Los grandes modelos de lenguaje (LLMs) se utilizan cada vez más como agentes en entornos dinámicos y del mundo real, donde el éxito requiere tanto razonamiento como el uso efectivo de herramientas. Un desafío central para las tareas agente es la creciente longitud del contexto, ya que los agentes deben acumular largas historias de acciones y observaciones. Esta expansión aumenta los costos y reduce la eficiencia en tareas de largo horizonte, sin embargo, trabajos previos sobre compresión de contexto se han enfocado principalmente en tareas de un solo paso o aplicaciones específicas. Presentamos Agent Context Optimization (ACON), un marco unificado que comprime óptimamente tanto las observaciones del entorno como las historias de interacción en condensaciones concisas pero informativas. ACON aprovecha la optimización de directrices de compresión en el espacio del lenguaje natural: dado pares de trayectorias donde el contexto completo tiene éxito pero el contexto comprimido falla, LLMs capaces analizan las causas del fracaso y la directriz de compresión se actualiza en consecuencia. Además, proponemos destilar el compresor LLM optimizado en modelos más pequeños para reducir la sobrecarga del módulo adicional. Experimentos en AppWorld, OfficeBench y Multi-objective QA muestran que ACON reduce el uso de memoria entre 26-54 % (tokens máximos) mientras preserva en gran medida el rendimiento de la tarea, mantiene más del 95 % de la precisión cuando se destila en compresores más pequeños, y mejora modelos de lenguaje más pequeños como agentes de largo horizonte con hasta un 46 % de mejora en rendimiento.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Minki Kang

Weining Chen

Donglin Han

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

ACON: Optimización de la compresión de contexto para agentes LLM de largo horizonte

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider