Key points are not available for this paper at this time.
Knowledge Distillation, eine der prominentesten Methoden in der Modellkompression, hat erfolgreich kleine Modellgrößen mit hoher Leistung in Einklang gebracht. Es wurde jedoch beobachtet, dass sich Knowledge Distillation überwiegend darauf konzentriert, Wissen aus dem Datensatz und externes Wissen, das vom Lehrer vermittelt wird, zu erwerben. Im Gegensatz dazu beschäftigt sich Self-Distillation mit der Nutzung des internen Wissens des Netzwerks. Keine der beiden Ansätze erschöpft das Potenzial des Wissens vollständig. Daher stellt dieses Papier den kombinierten Knowledge-Distillation-Rahmen vor, der Knowledge Distillation mit Self-Distillation kombiniert. Innerhalb dieses Rahmens führen wir mehrere flache Klassifikatoren ein, kombiniert mit einem Aufmerksamkeitsmodul, um internes und externes Wissen zu nutzen und die Effizienz der Wissensnutzung des Netzwerks zu verbessern. Experimentelle Ergebnisse zeigen, dass durch umfassende Nutzung des Netzwerkwissens die Distillationseffektivität verbessert werden kann, was zu weiteren Genauigkeitssteigerungen des Netzwerks führt. Zusätzlich haben wir den Rahmen auf leichte neuronale Netzwerke mit Gruppenkonvolution angewandt, wobei der Rahmen weiterhin außergewöhnlich gute Leistungen erbringt.
Building similarity graph...
Analyzing shared references across papers
Loading...
Shuiping Ni
Wendi Wang Shuiping Ni
Mingfu Zhu Wendi Wang
電腦學刊
Building similarity graph...
Analyzing shared references across papers
Loading...
Ni et al. (Do,) untersuchten diese Fragestellung.
www.synapsesocial.com/papers/68e5e2bfb6db64358757761a — DOI: https://doi.org/10.53106/199115992024083504008
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context: