Torch-Pruning项目中VGG19模型剪枝后精度骤降问题分析

2025-06-27 22:17:11作者：瞿蔚英Wynne

[CVPR 2023] Towards Any Structural Pruning; LLMs / Diffusion / Transformers / YOLOv8 / CNNs

项目地址：https://gitcode.com/gh_mirrors/to/Torch-Pruning

问题背景

在使用Torch-Pruning项目对CIFAR-100数据集上的VGG19模型进行剪枝时，研究人员发现了一个典型现象：直接剪枝后模型精度从73.5%骤降至1%，这与项目文档中宣称的70.39%剪枝后精度存在显著差异。

技术细节解析

模型剪枝的基本流程

预训练模型加载：首先加载在CIFAR-100上预训练好的VGG19模型，原始精度为73.5%
全局剪枝策略：采用group_norm方法进行全局剪枝，目标加速比为8.84倍
剪枝效果评估：剪枝后模型参数量从20.09M减少到1.38M(保留6.89%)，计算量从512.73M减少到57.48M(保留11.21%)

精度骤降原因

剪枝操作本质上是对神经网络结构的破坏性修改，直接移除大量参数会导致：

特征提取能力丧失：特别是第一层卷积从3通道剪到2通道，严重影响了输入特征的处理
信息流中断：某些中间层通道数被剪至1-4个，几乎无法传递有效信息
分类器输入维度剧变：最终全连接层的输入特征从512维降至36维

解决方案：微调的必要性

原始问题中精度骤降的关键原因是忽略了剪枝后的微调步骤。正确的流程应该是：

执行剪枝操作
对剪枝后的模型进行再训练（微调）
评估最终精度

微调过程允许模型：

适应新的网络结构
重新学习特征表示
调整剩余参数的关系

实践建议

完整流程验证：任何剪枝实验都应包含剪枝+微调两个阶段
渐进式剪枝：对于高加速比需求，可考虑分阶段剪枝和微调
监控指标：不仅要关注参数量和计算量减少，更要跟踪精度变化
结构合理性检查：避免出现通道数降为1等极端情况

结论

这个案例展示了模型压缩中一个常见误区——忽视剪枝后的微调过程。Torch-Pruning项目提供的基准结果是经过完整流程得到的，而直接比较剪枝前后的精度是不合理的。在实际应用中，必须将剪枝视为模型优化的第一步，后续微调对恢复模型性能至关重要。

[CVPR 2023] Towards Any Structural Pruning; LLMs / Diffusion / Transformers / YOLOv8 / CNNs

项目地址：https://gitcode.com/gh_mirrors/to/Torch-Pruning

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

Ascend Extension for PyTorch

flutter_flutter

Nop Platform 2.0是基于可逆计算理论实现的采用面向语言编程范式的新一代低代码开发平台，包含基于全新原理从零开始研发的GraphQL引擎、ORM引擎、工作流引擎、报表引擎、规则引擎、批处理引引擎等完整设计。nop-entropy是它的后端部分，采用java语言实现，可选择集成Spring框架或者Quarkus框架。中小企业可以免费商用

ohos_react_native

React Native鸿蒙化仓库

🔥LeetCode solutions in any programming language | 多种编程语言实现 LeetCode、《剑指 Offer（第 2 版）》、《程序员面试金典（第 6 版）》题解

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

cangjie_compiler

仓颉编译器源码及 cjdb 调试工具。