PyTorch教程：神经网络代码与结构图对应关系解析

2025-05-27 09:15:58作者：范垣楠Rhoda

在PyTorch官方教程中，关于神经网络基础的部分展示了一个经典的卷积神经网络结构图及其实现代码。然而，初学者常常会遇到一个困惑：为什么代码中的层数与结构图中的层数看起来不一致？本文将深入解析这一现象，帮助读者理解PyTorch神经网络实现中的关键细节。

神经网络结构图与代码的对应关系

在教程中展示的神经网络结构图包含以下层次：

输入层(32x32图像)
卷积层C1(6个5x5卷积核)
下采样层S2(2x2最大池化)
卷积层C3(16个5x5卷积核)
下采样层S4(2x2最大池化)
全连接层F5(120个神经元)
全连接层F6(84个神经元)
输出层(10个神经元)

然而，在代码的__init__方法中，我们只看到了5个层的定义：

self.conv1 = nn.Conv2d(1, 6, 5)  # C1
self.conv2 = nn.Conv2d(6, 16, 5) # C3
self.fc1 = nn.Linear(16*5*5, 120) # F5
self.fc2 = nn.Linear(120, 84)     # F6
self.fc3 = nn.Linear(84, 10)      # 输出层

缺失的层去哪了？

实际上，完整的网络实现分散在两个部分：

__init__方法中定义了需要学习参数的层(卷积层和全连接层)
forward方法中定义了不需要学习参数的操作(池化层、激活函数和展平操作)

这种设计是PyTorch的常见模式，将需要训练的参数(权重和偏置)放在__init__中初始化，而将纯功能的操作放在forward中实现。

完整网络实现解析

更清晰的实现方式是在forward方法中也明确标注各层对应关系：

def forward(self, x):
    # C1: 卷积层 + ReLU激活
    x = F.relu(self.conv1(x))  
    # S2: 2x2最大池化
    x = F.max_pool2d(x, 2)     
    # C3: 卷积层 + ReLU激活
    x = F.relu(self.conv2(x))  
    # S4: 2x2最大池化
    x = F.max_pool2d(x, 2)     
    # 展平操作(多维张量转为一维)
    x = torch.flatten(x, 1)    
    # F5: 全连接层 + ReLU激活
    x = F.relu(self.fc1(x))    
    # F6: 全连接层 + ReLU激活
    x = F.relu(self.fc2(x))    
    # 输出层(无激活函数)
    x = self.fc3(x)            
    return x