基于Pytorch Lightning的MNIST分类入门实践

2026-02-04 04:11:52作者：裘旻烁

项目概述

本文将介绍一个使用PyTorch实现MNIST手写数字分类的简单全连接神经网络项目。该项目展示了如何从数据加载、模型构建到训练评估的完整机器学习流程，是深度学习入门的经典案例。

核心组件解析

1. 神经网络模型构建

项目定义了一个简单的全连接神经网络NN类，继承自nn.Module：

class NN(nn.Module):
    def __init__(self, input_size, num_classes):
        super().__init__()
        self.fc1 = nn.Linear(input_size, 50)
        self.fc2 = nn.Linear(50, num_classes)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x

该网络结构包含：

输入层：784个神经元（对应28x28的MNIST图像展平后的大小）
隐藏层：50个神经元，使用ReLU激活函数
输出层：10个神经元（对应0-9十个数字类别）

2. 数据准备与加载

项目使用PyTorch内置的MNIST数据集，并进行了训练集、验证集和测试集的划分：

entire_dataset = datasets.MNIST(root="dataset/", train=True, transform=transforms.ToTensor(), download=True)
train_ds, val_ds = random_split(entire_dataset, [50000, 10000])
test_ds = datasets.MNIST(root="dataset/", train=False, transform=transforms.ToTensor(), download=True)

关键点：

使用ToTensor()转换将图像数据转换为张量并归一化到[0,1]范围
原始训练集被划分为50000个样本的训练集和10000个样本的验证集
测试集使用官方提供的10000个样本

3. 训练流程

训练过程采用标准的深度学习训练循环：

for epoch in range(num_epochs):
    for batch_idx, (data, targets) in enumerate(tqdm(train_loader)):
        # 前向传播
        scores = model(data)
        loss = criterion(scores, targets)
        
        # 反向传播
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

训练配置：

损失函数：交叉熵损失（CrossEntropyLoss）
优化器：Adam优化器
学习率：0.001
批量大小：32
训练轮数：3

4. 模型评估

项目实现了一个check_accuracy函数来评估模型性能：

def check_accuracy(loader, model):
    num_correct = 0
    num_samples = 0
    model.eval()
    with torch.no_grad():
        for x, y in loader:
            # 计算预测准确率...
    model.train()
    return num_correct / num_samples

评估时需要注意：

使用model.eval()将模型切换到评估模式
使用torch.no_grad()上下文管理器禁用梯度计算
评估完成后使用model.train()将模型切换回训练模式

技术要点深入

1. 设备选择自动化

项目自动检测并选择可用的计算设备：

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

这一行代码使得项目可以无缝运行在CPU或GPU上，提高了代码的通用性。

2. 数据预处理

MNIST图像数据通过ToTensor()转换：

自动将PIL图像或NumPy数组转换为PyTorch张量
将像素值从[0,255]缩放到[0,1]范围
自动处理图像通道维度

3. 模型设计选择

选择全连接网络处理MNIST数据的考虑：

MNIST是相对简单的数据集，全连接网络已经足够
输入层784个神经元对应28x28展平后的图像
隐藏层50个神经元是经验选择，可以调整
输出层10个神经元对应10个数字类别

实践建议

超参数调优：可以尝试调整学习率、批量大小、隐藏层大小等超参数来观察模型性能变化
模型扩展：
- 增加更多隐藏层
- 尝试不同的激活函数
- 添加Dropout层防止过拟合
可视化：添加训练损失和准确率的可视化可以帮助理解训练过程
早停机制：可以基于验证集准确率实现早停，防止过拟合

总结

这个项目展示了使用PyTorch实现MNIST分类的完整流程，涵盖了数据加载、模型构建、训练和评估等关键环节。虽然模型结构简单，但包含了深度学习项目的基本要素，是学习PyTorch和深度学习的良好起点。通过这个基础项目，开发者可以进一步探索更复杂的模型结构和训练技巧。

Machine-Learning-Collection

A resource for learning about Machine learning & Deep Learning

项目地址：https://gitcode.com/gh_mirrors/ma/Machine-Learning-Collection

登录后查看全文

基于Pytorch Lightning的MNIST分类入门实践

项目概述

核心组件解析

1. 神经网络模型构建

2. 数据准备与加载

3. 训练流程

4. 模型评估

技术要点深入

1. 设备选择自动化

2. 数据预处理

3. 模型设计选择

实践建议

总结

热门内容推荐

最新内容推荐

项目优选

基于Pytorch Lightning的MNIST分类入门实践

项目概述

核心组件解析

1. 神经网络模型构建

2. 数据准备与加载

3. 训练流程

4. 模型评估

技术要点深入

1. 设备选择自动化

2. 数据预处理

3. 模型设计选择

实践建议

总结

相关内容推荐

热门内容推荐

最新内容推荐

项目优选