目的动态数据剪枝是提升自监督预训练效率的重要手段,但现有方法多基于瞬时损失进行剪枝,难以应对自监督训练中损失波动剧烈、优化不稳定的问题,易造成关键样本被误剪和模型性能退化。针对上述缺陷,本文提出了面向自监督学习的课程式动态数据剪枝方法。方法首先设计指数损失重要性表征,通过动量系数对样本历史损失做指数移动平均,获取时序平滑且对短期损失波动鲁棒的样本价值表征,避免因瞬时损失扰动而误判关键样本;在此基础上,进一步提出课程式动态剪枝策略。该策略通过一维聚类进行样本分组,形成从易到难的课程集合,进而引入滑动窗口机制来动态控制各课程的训练进度,引导模型渐进式学习以有效保障训练过程的稳定性。结果在8个二维图像与三维点云基准数据集上,采用掩码自编码器(masked autoencoder,MAE)、动量对比学习(momentum contrast,MoCo)、点云掩码自编码器(point cloud masked autoencoder,PointMAE)等主流预训练框架,结合视觉Transformer(vision transformer,ViT)、残差网络(residual network,ResNet)等骨干网络开展了5组系统的对比实验。实验结果显示,在更高的数据剪枝率下,本文方法的性能全面优于现有的动态剪枝方法。同时,与全量数据训练策略相比,本文方法在下游任务上取得了近乎无损的性能。消融实验也验证了本文方法中各核心组件的有效性。结论本文方法通过指数损失驱动的样本重要性度量与课程式动态剪枝策略,有效突破了现有数据剪枝方法在自监督学习场景的应用局限,在性能近乎无损的前提下大幅提升了自监督预训练效率(在ImageNet-1K数据集上最高可剪枝30.6%的训练数据),为视觉模型的高效自监督训练提供了可靠的技术支撑。
Building similarity graph...
Analyzing shared references across papers
Loading...
Liu Wenhao
Zhang Zhaoming
Zhang Ye
Journal of Image and Graphics
Building similarity graph...
Analyzing shared references across papers
Loading...
Wenhao et al. (Thu,) studied this question.
www.synapsesocial.com/papers/69d894526c1944d70ce05334 — DOI: https://doi.org/10.11834/jig.250542