Los agentes basados en Modelos de Lenguaje Grandes (LLM) son sistemas autónomos impulsados por LLMs, capaces de razonar y planificar para resolver problemas aprovechando un conjunto de herramientas. Sin embargo, la integración de capacidades multi-herramienta en agentes LLM introduce desafíos para gestionar las herramientas de manera segura, garantizar su compatibilidad, manejar relaciones de dependencia y proteger los flujos de control dentro de los flujos de trabajo de agentes LLM. En este artículo, presentamos el primer análisis sistemático de seguridad sobre los flujos de control de tareas en agentes LLM habilitados con múltiples herramientas. Identificamos una amenaza novedosa, Recolección y Contaminación Entre Herramientas (XTHP), que incluye múltiples vectores de ataque para primero secuestrar los flujos normales de control de las tareas del agente y luego recopilar y contaminar información confidencial o privada dentro de sistemas de agentes LLM. Para entender el impacto de esta amenaza, desarrollamos Chord, una herramienta de escaneo dinámica diseñada para detectar automáticamente herramientas de agentes del mundo real susceptibles a ataques XTHP. Nuestra evaluación de 66 herramientas del mundo real provenientes de los repositorios de dos marcos principales de desarrollo de agentes LLM, LangChain y LlamaIndex, reveló una preocupación significativa de seguridad: el 75% son vulnerables a ataques XTHP, destacando la prevalencia de esta amenaza.
Building similarity graph...
Analyzing shared references across papers
Loading...
Zichuan Li
Jian Cui
Xiaojing Liao
Building similarity graph...
Analyzing shared references across papers
Loading...
Li et al. (Thu,) estudiaron esta cuestión.
www.synapsesocial.com/papers/690e8b6ca5b062d7a4e73361 — DOI: https://doi.org/10.48550/arxiv.2504.03111