YOLOv5模型训练与推理结果不一致问题深度解析

2025-05-01 06:58:43作者：邓越浪Henry

问题现象

在使用YOLOv5进行目标检测任务时，开发者经常遇到一个令人困惑的现象：模型在验证集(val.py)上表现出很高的mAP指标，但在实际使用detect.py进行推理时却无法检测出目标。这种训练评估与实际推理结果不一致的问题，在计算机视觉领域具有一定的典型性。

问题本质分析

这种现象本质上反映了模型训练与推理环境之间的不一致性，主要涉及以下几个技术层面：

数据预处理流程差异：验证脚本(val.py)和推理脚本(detect.py)可能采用了不同的图像预处理方式
后处理参数设置：非极大值抑制(NMS)的阈值参数在不同脚本中的默认值可能不同
模型输入尺寸：训练时使用的图像尺寸与推理时可能不一致
数据增强差异：验证时可能关闭了数据增强而推理时可能意外启用

技术细节探究

预处理流程差异

YOLOv5在训练和验证阶段使用了一套标准化的预处理流程，包括：

图像自动调整为模型输入尺寸(如640x640)
像素值归一化到0-1范围
通道顺序从BGR转为RGB

而在自定义推理脚本中，如果开发者直接使用OpenCV读取图像而不进行相应处理，就会导致模型接收到的数据分布与训练时不同。

后处理参数影响

非极大值抑制(NMS)是目标检测中关键的后处理步骤，其两个主要参数：

置信度阈值(conf_thres)：过滤低置信度预测
IoU阈值(iou_thres)：控制重叠框的合并程度

验证脚本通常使用较宽松的阈值(如conf_thres=0.001)，而推理脚本默认使用更严格的阈值(如conf_thres=0.25)。这种差异会显著影响最终检测结果的数量。

输入尺寸不一致性

YOLOv5模型对输入尺寸较为敏感。如果在训练时使用了特定尺寸(如640x640)，而在推理时输入了不同尺寸的图像，模型性能会下降。这是因为：

特征金字塔的感受野发生变化
锚框(anchor)的匹配效果变差
模型对目标尺度的适应性降低

解决方案与实践建议

确保预处理一致性

在自定义推理脚本中，应当严格复制训练时的预处理流程：

# 正确的预处理示例
img = cv2.imread(image_path)
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)  # BGR转RGB
img = cv2.resize(img, (640, 640))  # 调整到模型输入尺寸
img = img.astype(np.float32) / 255.0  # 归一化
img = torch.from_numpy(img).permute(2, 0, 1)  # HWC转CHW