DEYOLO项目配置参数详解：从训练到预测的完整指南

2025-06-19 07:40:47作者：吴年前Myrtle

前言

在目标检测领域，YOLO系列算法因其出色的性能和实时性而广受欢迎。DEYOLO作为基于YOLOv8的改进项目，提供了丰富的配置选项来满足不同场景下的需求。本文将全面解析DEYOLO中的各类配置参数，帮助开发者更好地理解和使用这些参数来优化模型性能。

基础概念

任务类型(TASK)

DEYOLO支持多种计算机视觉任务，每种任务对应不同的输出类型：

检测(detect)：识别图像中的物体并定位其位置（输出边界框）
分割(segment)：对图像进行像素级分类（输出掩码）
分类(classify)：对整张图像进行分类（输出类别）
姿态估计(pose)：检测物体并估计其关键点位置

任务类型通常可以从模型文件中自动推断，但也可以显式指定。

运行模式(MODE)

DEYOLO支持6种主要运行模式：

训练(train)：在自定义数据集上训练模型
验证(val)：评估训练好的模型性能
预测(predict)：在新数据上进行推理
导出(export)：将模型转换为部署格式
跟踪(track)：实时目标跟踪
基准测试(benchmark)：测试导出模型的性能

训练配置详解

训练是模型开发中最关键的环节，合理的参数设置直接影响模型最终性能。

基础参数

参数	默认值	说明
epochs	100	训练总轮数
batch	16	每批次处理的图像数量(-1表示自动调整)
imgsz	640	输入图像尺寸(可指定为w,h)
data	None	数据集配置文件路径(如coco128.yaml)
model	None	模型配置文件或权重文件路径

优化器相关

optimizer: 'auto'  # 可选SGD/Adam/AdamW等
lr0: 0.01         # 初始学习率(SGD通常1e-2, Adam 1e-3)
lrf: 0.01         # 最终学习率=lr0*lrf
momentum: 0.937   # SGD动量/Adam beta1
weight_decay: 0.0005  # 权重衰减系数

学习率调度

cos_lr: False      # 是否使用余弦学习率调度
warmup_epochs: 3.0 # 学习率预热轮数
warmup_momentum: 0.8  # 预热阶段初始动量
warmup_bias_lr: 0.1   # 预热阶段偏置项学习率

损失函数权重

box: 7.5       # 边界框损失权重
cls: 0.5       # 分类损失权重
dfl: 1.5       # 分布焦点损失权重
pose: 12.0     # 姿态估计损失权重(仅pose任务)
kobj: 2.0      # 关键点目标损失权重(仅pose任务)

数据增强

close_mosaic: 0  # 最后多少轮禁用mosaic增强
label_smoothing: 0.0  # 标签平滑系数
overlap_mask: True  # 分割任务中是否允许掩码重叠
mask_ratio: 4     # 分割掩码下采样比例

预测配置解析

预测阶段的参数设置直接影响推理结果和性能。

基础参数

参数	默认值	说明
source	'assets'	输入源路径(图片/视频/目录)
conf	0.25	检测置信度阈值
iou	0.7	NMS的IoU阈值
max_det	300	每张图像最大检测数量

输出控制

save: False      # 是否保存带结果的图像
save_txt: False  # 是否保存结果为txt文件
save_conf: False # 是否在txt结果中包含置信度
save_crop: False # 是否保存检测到的物体裁剪图
show_labels: True  # 是否在图像上显示标签
show_conf: True    # 是否显示置信度分数

高级选项

agnostic_nms: False  # 是否使用类别无关的NMS
retina_masks: False  # 是否使用高分辨率分割掩码
augment: False       # 是否对预测源进行数据增强
visualize: False     # 是否可视化模型特征

验证配置要点

验证阶段用于评估模型性能，关键参数包括：

save_json: False  # 是否保存结果为JSON格式
save_hybrid: False  # 是否保存混合标签(原始标签+预测结果)
plots: False      # 是否生成评估图表
rect: False       # 是否使用矩形验证(减少填充)
split: 'val'      # 使用哪个数据集分割(val/test/train)

模型导出配置

将训练好的模型导出为不同格式时，需注意以下参数：

参数	说明
format	导出格式(torchscript/onnx等)
imgsz	导出模型的输入尺寸
half	是否使用FP16量化
int8	是否使用INT8量化
dynamic	是否允许动态输入尺寸
simplify	是否简化ONNX模型
opset	ONNX算子集版本