What type of study is this?

This is a Quantitative Study study.

September 29, 2025Open Access

El Nacimiento del Conocimiento: Características Emergentes a través del Tiempo, el Espacio y la Escala en Grandes Modelos de Lenguaje

Puntos clave

Los resultados muestran que características categóricas interpretables emergen en umbrales temporales y de escala distintos en grandes modelos de lenguaje, desafiando las suposiciones existentes.
El análisis espacial descubrió una reactivación inesperada de características semánticas de capas tempranas en capas posteriores, indicando una dinámica representacional compleja.
La interpretabilidad mecánica se logró mediante el uso de autoencoders dispersos, permitiendo obtener información sobre la activación de conceptos semánticos.
Los hallazgos proporcionan una nueva comprensión del comportamiento de grandes modelos de lenguaje en diferentes puntos de control de entrenamiento y escalas de modelo.

Resumen

Este artículo estudia la emergencia de características categóricas interpretables dentro de grandes modelos de lenguaje (LLMs), analizando su comportamiento a través de puntos de control de entrenamiento (tiempo), capas transformadoras (espacio) y tamaños variados de modelos (escala). Utilizando autoencoders dispersos para la interpretabilidad mecánica, identificamos cuándo y dónde emergen conceptos semánticos específicos dentro de las activaciones neuronales. Los resultados indican umbrales claros específicos en tiempo y escala para la aparición de características en múltiples dominios. Notablemente, el análisis espacial revela una reactivación semántica inesperada, con características de capas tempranas que reaparecen en capas posteriores, desafiando las suposiciones estándar sobre la dinámica representacional en modelos transformadores.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Shashata Sawmya

Micah Adler

Nir Shavit

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

El Nacimiento del Conocimiento: Características Emergentes a través del Tiempo, el Espacio y la Escala en Grandes Modelos de Lenguaje

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider