Los puntos clave no están disponibles para este artículo en este momento.
Recientemente, los modelos de lenguaje fundamentales (LMs) han logrado avances significativos en los campos del procesamiento del lenguaje natural (NLP) y la visión por computadora (CV). A diferencia de los modelos tradicionales de redes neuronales, los LMs fundamentales obtienen una gran capacidad para el aprendizaje por transferencia al adquirir un rico conocimiento del sentido común mediante un preentrenamiento en conjuntos de datos no supervisados extensos con un gran número de parámetros. Sin embargo, todavía no pueden emular el aprendizaje continuo similar al humano debido al olvido catastrófico. En consecuencia, se han desarrollado diversas metodologías basadas en el aprendizaje continuo (CL) para refinar los LMs, permitiéndoles adaptarse a nuevas tareas sin olvidar conocimientos previos. Sin embargo, aún falta una taxonomía sistemática de los enfoques existentes y una comparación de su desempeño, lo que es la brecha que nuestra encuesta pretende llenar. Profundizamos en una revisión exhaustiva, resumen y clasificación de la literatura existente sobre enfoques basados en CL aplicados a modelos de lenguaje fundamentales, como los modelos de lenguaje preentrenados (PLMs), los grandes modelos de lenguaje (LLMs) y los modelos de visión-lenguaje (VLMs). Dividimos estos estudios en CL offline y CL online, que consisten en métodos tradicionales, métodos basados en eficiencia de parámetros, métodos basados en ajuste por instrucciones y métodos de preentrenamiento continuo. El CL offline abarca el aprendizaje incremental por dominio, incremental por tarea e incremental por clase, mientras que el CL online se subdivide en configuraciones de límite duro de tarea y límite difuso de tarea. Además, describimos los conjuntos de datos y métricas típicos empleados en la investigación de CL y proporcionamos un análisis detallado de los desafíos y trabajos futuros para el aprendizaje continuo basado en LMs.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yutao Yang
Jie Zhou
Xuanwen Ding
Building similarity graph...
Analyzing shared references across papers
Loading...
Yang et al. (Tue,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68e68232b6db64358760b9ff — DOI: https://doi.org/10.48550/arxiv.2405.18653
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: