August 1, 2024

Kombinierter Knowledge-Distillation-Rahmen: Wissensbarrieren überwinden

Key Points

Key points are not available for this paper at this time.

Abstract

Knowledge Distillation, eine der prominentesten Methoden in der Modellkompression, hat erfolgreich kleine Modellgrößen mit hoher Leistung in Einklang gebracht. Es wurde jedoch beobachtet, dass sich Knowledge Distillation überwiegend darauf konzentriert, Wissen aus dem Datensatz und externes Wissen, das vom Lehrer vermittelt wird, zu erwerben. Im Gegensatz dazu beschäftigt sich Self-Distillation mit der Nutzung des internen Wissens des Netzwerks. Keine der beiden Ansätze erschöpft das Potenzial des Wissens vollständig. Daher stellt dieses Papier den kombinierten Knowledge-Distillation-Rahmen vor, der Knowledge Distillation mit Self-Distillation kombiniert. Innerhalb dieses Rahmens führen wir mehrere flache Klassifikatoren ein, kombiniert mit einem Aufmerksamkeitsmodul, um internes und externes Wissen zu nutzen und die Effizienz der Wissensnutzung des Netzwerks zu verbessern. Experimentelle Ergebnisse zeigen, dass durch umfassende Nutzung des Netzwerkwissens die Distillationseffektivität verbessert werden kann, was zu weiteren Genauigkeitssteigerungen des Netzwerks führt. Zusätzlich haben wir den Rahmen auf leichte neuronale Netzwerke mit Gruppenkonvolution angewandt, wobei der Rahmen weiterhin außergewöhnlich gute Leistungen erbringt.

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Authors

Shuiping Ni

Wendi Wang Shuiping Ni

Mingfu Zhu Wendi Wang

Journals

電

電腦學刊

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Kombinierter Knowledge-Distillation-Rahmen: Wissensbarrieren überwinden

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Authors

Journals

Actions

References and Citations

Citation Network

Connected Papers

Discussion

Cite this study

Also consider