【亲测免费】 PyTorch Image Models 安装和配置指南

2026-01-20 02:53:05作者：舒璇辛Bertina

The largest collection of PyTorch image encoders / backbones. Including train, eval, inference, export scripts, and pretrained weights -- ResNet, ResNeXT, EfficientNet, NFNet, Vision Transformer (ViT), MobileNetV4, MobileNet-V3 & V2, RegNet, DPN, CSPNet, Swin Transformer, MaxViT, CoAtNet, ConvNeXt, and more

项目地址：https://gitcode.com/GitHub_Trending/py/pytorch-image-models

1. 项目基础介绍和主要编程语言

项目介绍

PyTorch Image Models（简称 timm）是一个开源项目，提供了大量用于图像分类的预训练模型、层、工具、优化器、调度器、数据加载器和数据增强方法。该项目的目标是整合各种最先进的（SOTA）模型，并能够重现 ImageNet 训练结果。

主要编程语言

该项目主要使用 Python 编程语言，并基于 PyTorch 深度学习框架。

2. 项目使用的关键技术和框架

关键技术

PyTorch: 一个开源的深度学习框架，提供了强大的张量计算和自动求导功能。
预训练模型: 包括 ResNet、ResNeXT、EfficientNet、Vision Transformer (ViT)、MobileNet 等多种模型。
数据增强: 提供了多种数据增强方法，用于提高模型的泛化能力。
优化器和调度器: 支持多种优化器和学习率调度器，帮助模型更好地收敛。

框架

PyTorch: 作为主要的深度学习框架，支持模型的训练和推理。
TorchVision: 提供了常用的计算机视觉工具和数据集。

3. 项目安装和配置的准备工作和详细安装步骤

准备工作

在开始安装之前，请确保你的系统已经安装了以下软件和工具：

Python 3.6 或更高版本
PyTorch 1.7 或更高版本
CUDA（如果需要使用 GPU 加速）
Git（用于克隆项目仓库）

详细安装步骤

步骤 1：克隆项目仓库

首先，使用 Git 克隆 timm 项目仓库到本地：

git clone https://github.com/huggingface/pytorch-image-models.git

步骤 2：进入项目目录

进入克隆下来的项目目录：

cd pytorch-image-models

步骤 3：安装依赖

使用 pip 安装项目所需的依赖包。你可以使用项目提供的 requirements.txt 文件来安装所有依赖：

pip install -r requirements.txt

步骤 4：安装 `timm` 包

在项目根目录下，使用 pip 安装 timm 包：

pip install .

步骤 5：验证安装

安装完成后，你可以通过以下命令验证 timm 是否安装成功：

import timm
print(timm.__version__)

如果输出了版本号，说明安装成功。

配置和使用

安装完成后，你可以开始使用 timm 提供的各种预训练模型和工具。例如，加载一个预训练的 ResNet 模型：

import torch
import timm

model = timm.create_model('resnet50', pretrained=True)
model.eval()

# 示例输入
input_tensor = torch.randn(1, 3, 224, 224)
output = model(input_tensor)
print(output.shape)  # 输出: torch.Size([1, 1000])