Presentamos un sistema de consolidación de memoria para modelos de lenguaje grande (LLMs) que implementa un ciclo completo de conocimiento: extracción continua de hechos desde el diálogo, recuperación sensible al contexto activada por SAE, consolidación sináptica fuera de línea en subespacios de pesos, y olvido estructurado mediante decaimiento de fuerza basado en tiempo. El sistema utiliza características del autoencoder disperso GemmaScope-2 en la capa 16 de Gemma-3-4B como disparadores para la recuperación de memoria, y realiza actualizaciones de mínimos cuadrados restringidos en los pesos de proyección descendente MLP en las capas 25–27 con ortogonalización Gram-Schmidt para proteger el conocimiento consolidado. Evaluado en 1,000 casos CounterFact, el método alcanza 78.0% de eficacia, 77.6% de generalidad y 100% de especificidad, con una perturbación de peso 29 veces menor que el ajuste fino estándar (ΔW = 0.004 vs. 0.118). El análisis mecanicista confirma que la reducción de rango está localizada en las capas 25–27, con una proporción de especificidad de edición de 3.4×. El sistema también reproduce la dinámica de olvido estilo Ebbinghaus y demuestra persistencia paramétrica de la memoria implícita tras limpieza del índice. Este es un preprint preliminar (v1.0, abril de 2026). El código y versiones actualizadas se publicarán en futuras revisiones.
Building similarity graph...
Analyzing shared references across papers
Loading...
H Zhang
Kyushu University
Building similarity graph...
Analyzing shared references across papers
Loading...
H Zhang (Sun,) estudió esta cuestión.
www.synapsesocial.com/papers/69e713fdcb99343efc98d71b — DOI: https://doi.org/10.5281/zenodo.19651263
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: