Key points are not available for this paper at this time.
知识蒸馏对于训练小型且可泛化的网络模型以满足低内存和快速运行的需求非常有效。现有的离线蒸馏方法依赖于强大的预训练教师模型,这有助于知识的有效发现和传递,但需要复杂的两阶段训练过程。在线蒸馏方法虽解决了这一限制,但代价是缺乏高容量教师模型。在本工作中,我们提出了动态本地集成(ONE)策略,实现单阶段的在线蒸馏。具体而言,ONE只训练一个多分支网络,同时动态构建一个强大的教师模型以增强目标网络的学习能力。大量评估表明,ONE在四个图像分类数据集:CIFAR10、CIFAR100、SVHN和ImageNet上,比其他方法更显著地提升了多种深度神经网络的泛化能力,同时具备计算效率优势。
Building similarity graph...
Analyzing shared references across papers
Loading...
Xu等人(Tue,)研究了这个问题。
www.synapsesocial.com/papers/6a08ebf71b91a3b1ea5b72ee — DOI: https://doi.org/10.48550/arxiv.1806.04606
Synapse has enriched 5 closely related papers on similar clinical questions. Consider them for comparative context:
Lan Xu
Xiatian Zhu
Shaogang Gong
Building similarity graph...
Analyzing shared references across papers
Loading...