June 12, 2018Open Access

动态本地集成的知识蒸馏

Key Points

Key points are not available for this paper at this time.

Abstract

知识蒸馏对于训练小型且可泛化的网络模型以满足低内存和快速运行的需求非常有效。现有的离线蒸馏方法依赖于强大的预训练教师模型，这有助于知识的有效发现和传递，但需要复杂的两阶段训练过程。在线蒸馏方法虽解决了这一限制，但代价是缺乏高容量教师模型。在本工作中，我们提出了动态本地集成（ONE）策略，实现单阶段的在线蒸馏。具体而言，ONE只训练一个多分支网络，同时动态构建一个强大的教师模型以增强目标网络的学习能力。大量评估表明，ONE在四个图像分类数据集：CIFAR10、CIFAR100、SVHN和ImageNet上，比其他方法更显著地提升了多种深度神经网络的泛化能力，同时具备计算效率优势。

Connected Papers

Building similarity graph...

Analyzing shared references across papers

Discussion

Cite this study

Xu等人（Tue，）研究了这个问题。

www.synapsesocial.com/papers/6a08ebf71b91a3b1ea5b72ee — DOI: https://doi.org/10.48550/arxiv.1806.04606

Also consider

Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:

Fast R-CNN· 2015 · 1,769 citations
Very Deep Convolutional Networks for Large-Scale Image Recognition· 2014 · 75,505 citations
Learning Multiple Layers of Features from Tiny Images· 2024 · 25,472 citations
CondenseNet: An Efficient DenseNet using Learned Group Convolutions· 2017 · 95 citations
Person Search by Multi-Scale Matching· 2018 · 11 citations

Authors

Lan Xu

Xiatian Zhu

Shaogang Gong

Actions

References and Citations

Connected Papers

Building similarity graph...

Analyzing shared references across papers

动态本地集成的知识蒸馏

Key Points

Abstract

Citation Network

Connected Papers

Discussion

Cite this study

Also consider

Authors

Actions

References and Citations

Citation Network

Connected Papers

Discussion