La alucinación, la generación de contenido plausible pero factualmente incorrecto, sigue siendo una barrera crítica para el despliegue confiable de grandes modelos de lenguaje (LLMs). Esta revisión sintetiza el estado del arte en la comprensión, detección y mitigación de las alucinaciones en LLMs. Comenzamos estableciendo una taxonomía clara, trazando la evolución del concepto de un noción amplia de error factual a una definición más precisa centrada en la falta de fidelidad al conocimiento accesible por el modelo. Luego examinamos metodologías de detección, categorizándolas según los requisitos de acceso al modelo y analizando técnicas como la estimación de incertidumbre, la verificación de consistencia y el anclaje en el conocimiento. Finalmente, proporcionamos una visión estructurada de las estrategias de mitigación organizadas por su aplicación a lo largo del ciclo de vida del modelo: (1) enfoques centrados en los datos, como la curación de alta calidad, (2) alineación centrada en el modelo mediante optimización de preferencias y edición de conocimiento, y (3) técnicas en tiempo de inferencia como la generación aumentada con recuperación (RAG) y la autocorrección. Concluimos que una estrategia en capas, de "defensa en profundidad", es esencial para una mitigación robusta. Los principales desafíos abiertos son la curación escalable de datos, el compromiso entre alineación y capacidad, y la edición de rutas de razonamiento sobre hechos.
Building similarity graph...
Analyzing shared references across papers
Loading...
Seyed Mahmoud Sajjadi Mohammadabadi
Burak Cem Kara
Can Eyüpoğlu
Building similarity graph...
Analyzing shared references across papers
Loading...
Mohammadabadi et al. (Wed,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68ebc91af2c3e4d8d926e2d4 — DOI: https://doi.org/10.20944/preprints202510.0540.v1
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: