El aprendizaje multi-tarea (MTL) tiene como objetivo construir sistemas de visión de propósito general entrenando una sola red para realizar múltiples tareas conjuntamente. Aunque prometedor, su potencial suele verse obstaculizado por la "optimización desequilibrada", donde la interferencia entre tareas conduce a un rendimiento inferior en comparación con modelos de tarea única. Para facilitar la investigación en MTL, este artículo presenta un análisis experimental sistemático para diseccionar los factores que contribuyen a este problema persistente. Nuestra investigación confirma que el rendimiento de los métodos de optimización existentes varía de manera inconsistente entre conjuntos de datos, y las arquitecturas avanzadas aún dependen de costosos pesos de pérdida buscados en una malla. Además, mostramos que aunque los potentes Modelos Fundamentales de Visión (VFMs) proporcionan una inicialización sólida, no resuelven inherentemente el desequilibrio de optimización, y simplemente aumentar la cantidad de datos ofrece beneficios limitados. Un hallazgo crucial que emerge de nuestro análisis es que existe una fuerte correlación entre el desequilibrio de optimización y la norma de los gradientes específicos de cada tarea. Demostramos que esta información es directamente aplicable, mostrando que una estrategia sencilla de escalar las pérdidas de las tareas según sus normas de gradiente puede lograr un rendimiento comparable al de una extensa y computacionalmente costosa búsqueda en malla. Nuestro análisis integral sugiere que entender y controlar la dinámica de los gradientes es un camino más directo hacia un MTL estable que desarrollar métodos cada vez más complejos.
Building similarity graph...
Analyzing shared references across papers
Loading...
Yihang Guo
Tianyuan Yu
Liang Bai
Building similarity graph...
Analyzing shared references across papers
Loading...
Guo et al. (Sun,) estudiaron esta cuestión.
www.synapsesocial.com/papers/68f5fcce8d54a28a75cf19d5 — DOI: https://doi.org/10.48550/arxiv.2509.23915
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: