Vorgeschlagen wird eine verbesserte LoRA (Low-Rank Adaptation) MoE (Mixed Expert) Architektur, SLoRA (Enhanced LoRA MoE Architecture), die darauf abzielt, das zentrale Problem des effizienten Parameter-Fein-Tunings in Multitasking-Szenarien zu adressieren. Angesichts der hohen Kosten des traditionellen vollständigen Fein-Tunings bei zunehmender Parameteranzahl visueller Sprachmodelle und der Einschränkungen von LoRA als populärer PEFT (parameter-effizientes Fein-Tuning)-Methode im Multitasking – wie unzureichender Anpassungsfähigkeit und Schwierigkeiten bei der Erfassung komplexer Aufgabenmuster – sowie der Herausforderungen von katastrophalem Vergessen und Wissensfragmentierung bei vorhandenen Forschungen zur Integration von MoE-Mechanismen in LoRA, nutzt SLoRA orthogonale Zwangsoptimierung, um durch die Initialisierung des Zwangslösungsraums Störungen des bestehenden Wissens zu reduzieren, wodurch katastrophales Vergessen gemildert wird (die Genauigkeitserhaltungsrate alter Aufgaben beträgt 92,4 %, 16,1 % höher als bei LoRA), und eine optimierte MoE-Struktur, die allgemeine Experten (zur Bewahrung des vortrainierten Wissens) sowie aufgabenspezifische Experten (dynamische Routing-Anpassungsaufgaben) umfasst, um die Multitasking-Anpassungsfähigkeit zu verbessern. Experimentelle Ergebnisse zeigen, dass SLoRA bei Common-Sense-Reasoning-Aufgaben eine Genauigkeit erzielt, die 9,0 % höher als LoRA und 3,7 % höher als AdaLoRA im WSC-Datensatz ist, und dass die F1-Punktzahl um 7,7 % höher als bei LoRA und 2,9 % höher als bei AdaLoRA im CommonsenseQA-Datensatz ausfällt; bei multimodalen Aufgaben liegt der durchschnittliche Wert bis zu 15,3 % über dem von LoRA, was signifikante Vorteile gegenüber bestehenden Methoden belegt.
Building similarity graph...
Analyzing shared references across papers
Loading...
Ce Shi
Jin-Woo Jung
Applied Sciences
Dongguk University
Building similarity graph...
Analyzing shared references across papers
Loading...
Shi et al. (Tue,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/699fe32295ddcd3a253e6cd4 — DOI: https://doi.org/10.3390/app16052174
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: