Los grandes modelos de lenguaje (LLMs) destacan en muchas tareas de comprensión del lenguaje, pero tienen dificultades para razonar sobre conocimientos que evolucionan. Para abordar esto, trabajos recientes han explorado el aumento de los LLMs con grafos de conocimiento (KGs) para proporcionar información estructurada y actualizada. Sin embargo, muchos enfoques existentes asumen una instantánea estática del KG y pasan por alto la dinámica temporal y las inconsistencias factuales inherentes a datos del mundo real. Para enfrentar el desafío del razonamiento sobre conocimiento que cambia temporalmente, proponemos EvoReasoner, un algoritmo de razonamiento multi-salto con conciencia temporal que realiza el anclaje global-local de entidades, descomposición por múltiples rutas y puntuación con base temporal. Para asegurar que el KG subyacente permanezca preciso y actualizado, introducimos EvoKG, un módulo de evolución de KG tolerante al ruido que actualiza incrementalmente el KG a partir de documentos no estructurados mediante resolución de contradicciones basada en confianza y seguimiento de tendencias temporales. Evaluamos nuestro enfoque en bancos de pruebas de preguntas y respuestas temporales y en un novedoso escenario de extremo a extremo donde el KG se actualiza dinámicamente desde documentos sin procesar. Nuestro método supera tanto las líneas base basadas en prompting como las mejoradas con KG, reduciendo efectivamente la brecha entre LLMs pequeños y grandes en respuestas dinámicas. Notablemente, un modelo de 8 mil millones de parámetros usando nuestro enfoque iguala el rendimiento de un modelo de 671 mil millones incentivado siete meses después. Estos resultados resaltan la importancia de combinar el razonamiento temporal con la evolución del KG para un rendimiento robusto y actualizado de los LLMs. Nuestro código está disponible públicamente en github.com/junhongmit/TREK.
Building similarity graph...
Analyzing shared references across papers
Loading...
Junhong Lin
Song Wang
Xiaojie Guo
Building similarity graph...
Analyzing shared references across papers
Loading...
Lin et al. (Thu,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68de5da283cbc991d0a2092a — DOI: https://doi.org/10.48550/arxiv.2509.15464