Los grandes modelos de lenguaje (LLMs) enfrentan desafíos persistentes al manejar tareas de contexto extendido, especialmente el problema de pérdida en la mitad, donde la información ubicada en el centro de una entrada larga tiende a subutilizarse. Algunos métodos existentes que reducen la entrada corren el riesgo de descartar información clave, mientras que otros que extienden las ventanas de contexto a menudo conducen a una dispersión de la atención. Para abordar estas limitaciones, proponemos Tree of Agents (TOA), un marco de razonamiento multiagente que segmenta la entrada en fragmentos procesados por agentes independientes. Cada agente genera su cognición local, luego los agentes intercambian información dinámicamente para un razonamiento colaborativo a lo largo de rutas estructuradas en árbol. TOA permite que los agentes exploren diferentes órdenes de razonamiento para una comprensión de múltiples perspectivas, mitigando efectivamente el sesgo posicional y reduciendo las alucinaciones. Para mejorar la eficiencia del procesamiento, incorporamos almacenamiento en caché de prefijo-hash y estrategias de poda adaptativas, logrando mejoras significativas en el rendimiento con una sobrecarga API comparable. Los experimentos muestran que TOA, potenciado por el compacto LLaMA3.1-8B, supera significativamente a múltiples líneas base y demuestra un rendimiento comparable a los modelos comerciales más recientes y mucho más grandes, como Gemini1.5-pro, en diversas tareas de contexto extendido. El código está disponible en https://github.com/Aireduce952/Tree-of-Agents.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yu Song
Xiaofei Xu
Ke Deng
Building similarity graph...
Analyzing shared references across papers
Loading...
Song et al. (Mon,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68ec1be02b8fa9b2b78ad0c7 — DOI: https://doi.org/10.48550/arxiv.2509.06436
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: