What type of study is this?

This is a Experimental Study study.

October 3, 2025Open Access

Hacia un Aprendizaje Visual Continúo Robusto con Supervisión Multimodal de Prototipos

Puntos clave

MuproCL mejora el rendimiento en el aprendizaje visual continuo, manejando efectivamente la ambigüedad semántica.
El marco reemplaza objetivos únicos con múltiples prototipos contextualmente conscientes para mejorar la representación visual.
Experimentos extensivos muestran que MuproCL mejora la robustez en aplicaciones de aprendizaje continuo.
Empleando un agente ligero de modelo de lenguaje, MuproCL desambigua categorías y expande la representación visual.

Resumen

La supervisión guiada por lenguaje, que utiliza un objetivo semántico congelado de un Modelo de Lenguaje Preentrenado (PLM), ha emergido como un paradigma prometedor para el Aprendizaje Continúo visual (CL). Sin embargo, depender de un único objetivo introduce dos limitaciones críticas: 1) ambigüedad semántica, donde un nombre de categoría polisémico resulta en representaciones visuales conflictivas, y 2) diversidad visual intra-clase, donde un solo prototipo no logra capturar la rica variedad de apariencias visuales dentro de una clase. Para ello, proponemos MuproCL, un marco novedoso que reemplaza el objetivo único con múltiples prototipos contextualmente conscientes. Específicamente, empleamos un agente LLM ligero para realizar la desambiguación de categorías y la expansión visual-modal para generar un conjunto robusto de prototipos semánticos. Un mecanismo de agregación LogSumExp permite que el modelo visual se adapte alineándose con el prototipo más relevante para una imagen dada. Experimentos extensivos a través de varios baselines de CL demuestran que MuproCL mejora consistentemente el rendimiento y la robustez, estableciendo un camino más efectivo para el aprendizaje continuo guiado por lenguaje.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Xiwei Liu

Yulong Li

Yichen Li

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Hacia un Aprendizaje Visual Continúo Robusto con Supervisión Multimodal de Prototipos

Puntos clave

Resumen

Citation Network

Connected Papers

Discussion

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider