What type of study is this?

This is a Quantitative Study study.

October 10, 2025Open Access

Desbloqueando el aprendizaje en contexto para conjuntos de datos naturales más allá del modelado del lenguaje

Puntos clave

El aprendizaje en contexto (ICL) mejora el rendimiento en tareas sin actualizar pesos, crucial para adaptarse a diversos dominios.
Las repeticiones exactas de tokens en las secuencias de entrenamiento mejoran significativamente la estabilidad del ICL y reducen la transitoriedad en el rendimiento.
El nivel de dificultad de las tareas de entrenamiento es vital para la aparición efectiva del ICL en grandes modelos de lenguaje.
La aplicación de conocimientos sobre la aparición del ICL desbloquea con éxito capacidades para conjuntos de datos visuales y tareas de clasificación EEG.

Resumen

Los Grandes Modelos de Lenguaje (LLMs) exhiben Aprendizaje en Contexto (ICL), que permite al modelo realizar nuevas tareas condicionándose solo en los ejemplos proporcionados en el contexto sin actualizar los pesos del modelo. Si bien el ICL ofrece una adaptación rápida a través de tareas y dominios del lenguaje natural, su aparición es menos directa para modalidades más allá del texto. En este trabajo, descubrimos sistemáticamente propiedades presentes en los LLMs que apoyan la aparición del ICL para modelos autorregresivos y diversas modalidades promoviendo el aprendizaje de los mecanismos necesarios para el ICL. Identificamos las repeticiones exactas de tokens en las secuencias de datos de entrenamiento como un factor importante para el ICL. Tales repeticiones mejoran además la estabilidad y reducen la transitoriedad en el rendimiento del ICL. Además, enfatizamos la importancia de la dificultad de la tarea de entrenamiento para la aparición del ICL. Finalmente, aplicando nuestros nuevos conocimientos sobre la aparición del ICL, desbloqueamos capacidades de ICL para varios conjuntos de datos visuales y una tarea de clasificación EEG más desafiante.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Jelena Bratulić

Sudhanshu Mittal

David T. Hoffmann

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Desbloqueando el aprendizaje en contexto para conjuntos de datos naturales más allá del modelado del lenguaje

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider