YOLOv5预测结果格式解析与坐标表示方法详解

2025-05-01 05:44:51作者：郁楠烈Hubert

Ultralytics YOLOv5 in PyTorch > ONNX > CoreML > TFLite

项目地址：https://gitcode.com/GitHub_Trending/yo/yolov5

YOLOv5作为目标检测领域的代表性算法，其预测结果的输出格式和坐标表示方法是开发者需要掌握的基础知识。本文将深入解析YOLOv5的预测结果文件格式，并详细讲解不同坐标表示方法之间的区别与转换。

YOLOv5预测结果文件格式

YOLOv5在完成目标检测后，默认会生成包含检测结果的文本文件。这些文本文件采用特定的标准化格式存储检测框信息，每行对应一个检测到的目标对象，格式如下：

类别ID x_中心 y_中心宽度高度置信度

其中各字段含义为：

类别ID：检测到的目标类别编号，为整数值
x_中心：边界框中心点的x坐标，相对于图像宽度的归一化值(0-1)
y_中心：边界框中心点的y坐标，相对于图像高度的归一化值(0-1)
宽度：边界框的宽度，相对于图像宽度的归一化值(0-1)
高度：边界框的高度，相对于图像高度的归一化值(0-1)
置信度：模型对该检测结果的置信度分数(0-1)

这种归一化的存储格式具有跨图像尺寸的通用性，便于后续处理时适应不同分辨率的图像。

目标检测中的坐标表示方法

在计算机视觉领域，边界框(Bounding Box)的表示主要有三种常见方式，理解它们的区别对于正确使用YOLOv5的预测结果至关重要。

1. 中心坐标表示法(x_center, y_center, width, height)

这是YOLO系列算法内部使用的表示方法，特点如下：

使用边界框的中心点坐标和宽高来描述
所有值都是相对于图像尺寸的归一化值
便于计算交并比(IoU)和设计损失函数

转换公式：

x_center = (xmin + xmax) / 2 / image_width
y_center = (ymin + ymax) / 2 / image_height
width = (xmax - xmin) / image_width
height = (ymax - ymin) / image_height

2. 角点坐标表示法(x1, y1, x2, y2)

这种表示方法在标注工具中较为常见：

(x1, y1)表示边界框左上角坐标
(x2, y2)表示边界框右下角坐标
可以是绝对像素值或归一化值
直观易理解，便于人工标注和可视化

转换公式：

x1 = (x_center - width/2) * image_width
y1 = (y_center - height/2) * image_height
x2 = (x_center + width/2) * image_width
y2 = (y_center + height/2) * image_height

3. 极值坐标表示法(xmin, ymin, xmax, ymax)

这种表示方法与角点坐标法本质相同，只是命名更加语义化：

(xmin, ymin)表示边界框左上角坐标
(xmax, ymax)表示边界框右下角坐标
常用于某些数据集的标准格式(如PASCAL VOC)
转换公式与角点坐标法相同

实际应用中的注意事项

在使用YOLOv5进行目标检测时，开发者需要注意以下几点：

预处理一致性：不同预测方式(detect.py脚本与直接加载模型)可能采用不同的预处理流程，这会导致预测结果的差异。
模型状态：直接加载模型时，务必调用model.eval()将模型设置为评估模式，否则Batch Normalization等层的行为会不一致。
后处理参数：非极大值抑制(NMS)的阈值等参数需要保持一致，这些参数会影响最终输出的检测框数量和位置。
坐标转换：在不同表示法之间转换时，要注意当前值是归一化值还是绝对像素值，避免因忽略图像尺寸导致的错误。

理解这些坐标表示方法及其转换关系，将帮助开发者更灵活地处理YOLOv5的预测结果，并在不同应用场景间正确转换数据格式。

Ultralytics YOLOv5 in PyTorch > ONNX > CoreML > TFLite

项目地址：https://gitcode.com/GitHub_Trending/yo/yolov5

登录后查看全文

项目优选

收起

deepin linux kernel

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

Ascend Extension for PyTorch

ops-transformer

本项目是CANN提供的transformer类大模型算子库，实现网络在NPU上加速计算。

本项目是CANN提供的神经网络类计算算子库，实现网络在NPU上加速计算。

昇腾LLM分布式训练框架

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

flutter_flutter

本仓库是 Flutter SDK 与 Flutter Engine 的 OpenHarmony 适配版本，由 CPF-Flutter 团队维护。开发者可使用熟悉的 Flutter 技术栈开发 OpenHarmony 应用，3.35.7 及以后的适配版本可基于本仓库源码构建支持 OpenHarmony 的 Flutter Engine。

Oohos_react_native

React Native鸿蒙化仓库