Key points are not available for this paper at this time.
L'apprentissage continu peut permettre aux modèles vision-langage d'acquérir continuellement de nouvelles connaissances, sans avoir besoin d'accéder à l'ensemble du jeu de données historique. Cependant, atténuer la dégradation des performances dans les modèles à grande échelle est complexe en raison de (i) changements de paramètres tout au long de l'apprentissage de longue durée et (ii) charges computationnelles significatives associées à l'ajustement complet du modèle. Dans ce travail, nous présentons un cadre d'apprentissage continu efficace en paramètres pour réduire l'oubli à long terme dans l'apprentissage incrémental avec des modèles vision-langage. Notre approche implique l'expansion dynamique d'un modèle CLIP pré-entraîné, via l'intégration d'adapteurs Mixture-of-Experts (MoE) en réponse à de nouvelles tâches. Pour préserver la capacité de reconnaissance zéro-shot des modèles vision-langage, nous introduisons en outre un Sélecteur Auto-Discriminatif de Distribution (DDAS) qui oriente automatiquement les entrées en distribution et hors distribution vers l'adapteur MoE et le CLIP original, respectivement. Grâce à de nombreuses expériences dans divers contextes, notre méthode proposée surpasse constamment les approches antérieures à l'état de l'art tout en réduisant simultanément la charge d'entraînement des paramètres de 60%. Notre code est disponible à https://github.com/JiazuoYu/MoE-Adapters4CL
Building similarity graph...
Analyzing shared references across papers
Loading...
Jiazuo Yu
Yunzhi Zhuge
Lu Zhang
Building similarity graph...
Analyzing shared references across papers
Loading...
Yu et al. (Mon,) ont étudié cette question.
www.synapsesocial.com/papers/68e73a7cb6db6435876b3b24 — DOI: https://doi.org/10.48550/arxiv.2403.11549
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: