May 28, 2024Open Access

Avances Recientes del Aprendizaje Continuo Basado en Modelos de Lenguaje Fundamentales: Una Encuesta

Puntos clave

Los puntos clave no están disponibles para este artículo en este momento.

Resumen

Recientemente, los modelos de lenguaje fundamentales (LMs) han logrado avances significativos en los campos del procesamiento del lenguaje natural (NLP) y la visión por computadora (CV). A diferencia de los modelos tradicionales de redes neuronales, los LMs fundamentales obtienen una gran capacidad para el aprendizaje por transferencia al adquirir un rico conocimiento del sentido común mediante un preentrenamiento en conjuntos de datos no supervisados extensos con un gran número de parámetros. Sin embargo, todavía no pueden emular el aprendizaje continuo similar al humano debido al olvido catastrófico. En consecuencia, se han desarrollado diversas metodologías basadas en el aprendizaje continuo (CL) para refinar los LMs, permitiéndoles adaptarse a nuevas tareas sin olvidar conocimientos previos. Sin embargo, aún falta una taxonomía sistemática de los enfoques existentes y una comparación de su desempeño, lo que es la brecha que nuestra encuesta pretende llenar. Profundizamos en una revisión exhaustiva, resumen y clasificación de la literatura existente sobre enfoques basados en CL aplicados a modelos de lenguaje fundamentales, como los modelos de lenguaje preentrenados (PLMs), los grandes modelos de lenguaje (LLMs) y los modelos de visión-lenguaje (VLMs). Dividimos estos estudios en CL offline y CL online, que consisten en métodos tradicionales, métodos basados en eficiencia de parámetros, métodos basados en ajuste por instrucciones y métodos de preentrenamiento continuo. El CL offline abarca el aprendizaje incremental por dominio, incremental por tarea e incremental por clase, mientras que el CL online se subdivide en configuraciones de límite duro de tarea y límite difuso de tarea. Además, describimos los conjuntos de datos y métricas típicos empleados en la investigación de CL y proporcionamos un análisis detallado de los desafíos y trabajos futuros para el aprendizaje continuo basado en LMs.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Yutao Yang

Jie Zhou

Xuanwen Ding

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Avances Recientes del Aprendizaje Continuo Basado en Modelos de Lenguaje Fundamentales: Una Encuesta

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider