PyTorch-Image-Models项目新增预激活ResNet-18模型支持

2025-05-04 23:30:33作者：邵娇湘

pytorch-image-models

huggingface/pytorch-image-models: 是一个由 Hugging Face 开发维护的 PyTorch 视觉模型库，包含多个高性能的预训练模型，适用于图像识别、分类等视觉任务。

项目地址：https://gitcode.com/GitHub_Trending/py/pytorch-image-models

在深度学习模型压缩领域，预激活ResNet（ResNetV2）作为基准模型被广泛使用。然而由于缺乏官方实现，不同研究论文中的模型精度存在差异，给研究者带来了困扰。PyTorch-Image-Models项目近期新增了对预激活ResNet-18和ResNet-34模型的支持，并提供了预训练权重下载，为相关研究提供了可靠的基准。

预激活ResNet（ResNetV2）相比传统ResNet的主要改进在于改变了残差块中激活函数和归一化层的位置。在ResNetV2中，每个残差块采用"预激活"结构，即先进行批归一化(BatchNorm)和ReLU激活，再进行卷积操作。这种设计使得信号可以直接在残差路径上传播，理论上能够缓解梯度消失问题，提升模型性能。

项目此次新增的模型包括两个变种：

标准预激活ResNet-18/34
改进版预激活ResNet-18d/34d

其中"d"变种采用了两种关键改进：

使用3个3x3卷积替代原始结构中的单个7x7卷积作为stem层
在下采样捷径连接中使用平均池化+1x1非步长卷积组合，而非传统的步长1x1卷积

这些改进虽然略微增加了参数量和计算量，但能更好地保留特征信息，通常能带来更好的模型性能。值得注意的是，3x3卷积stem设计不同于CIFAR等小尺寸数据集上常见的修改，后者主要是为了适应较小的输入尺寸而减少下采样次数。

对于模型压缩研究而言，预激活ResNet-18因其适中的规模成为理想选择。项目提供的预训练权重使用改进的训练配方，包括Randaugment数据增强和3600个epoch的训练周期，确保了模型性能的可靠性。

这一更新将有助于统一不同研究之间的比较基准，特别是在量化、剪枝和知识蒸馏等领域。研究者现在可以直接引用这些官方实现和预训练权重，避免因实现差异导致的性能偏差，从而更准确地评估新方法的有效性。

pytorch-image-models

huggingface/pytorch-image-models: 是一个由 Hugging Face 开发维护的 PyTorch 视觉模型库，包含多个高性能的预训练模型，适用于图像识别、分类等视觉任务。

项目地址：https://gitcode.com/GitHub_Trending/py/pytorch-image-models

登录后查看全文

项目优选

收起

deepin linux kernel

OpenHarmony documentation | OpenHarmony开发者文档

Ascend Extension for PyTorch

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统

本项目是CANN开源社区的核心管理仓库，包含社区的治理章程、治理组织、通用操作指引及流程规范等基础信息

ohos_react_native

React Native鸿蒙化仓库