在RF-DETR项目中保存预测结果为YOLO格式标签文件

2025-07-06 09:19:08作者：董斯意

RF-DETR作为基于DETR架构的目标检测模型，在实际应用中经常需要将预测结果保存为标注文件以便后续模型训练或数据增强。本文将详细介绍如何将RF-DETR的预测结果转换为YOLO格式的标签文件。

技术背景

YOLO格式是目标检测领域常用的标注格式，它以纯文本形式存储，每行表示一个检测对象，包含类别索引和归一化后的边界框坐标。这种格式因其简洁性和通用性而被广泛采用。

实现方法

RF-DETR项目提供了便捷的工具函数来实现预测结果到YOLO格式的转换。主要步骤如下：

加载模型和图像：首先需要实例化RF-DETR模型并加载待检测图像。
执行预测：调用模型的predict方法获取检测结果。
格式转换：使用supervision库中的工具函数将检测结果转换为YOLO格式的文本行。
保存文件：将转换后的文本内容保存为.txt文件。

代码实现

以下是完整的实现代码示例：

import cv2
from rfdetr import RFDETRBase
from supervision.dataset.formats.yolo import detections_to_yolo_annotations
from supervision.utils.file import save_text_file

# 初始化模型
model = RFDETRBase()

# 加载图像
image = cv2.imread("input_image.jpg")

# 执行预测（设置置信度阈值为0.5）
detections = model.predict(image, threshold=0.5)

# 转换为YOLO格式
lines = detections_to_yolo_annotations(
    detections=detections, 
    image_shape=image.shape
)

# 保存标注文件
save_text_file(lines=lines, file_path="output_annotation.txt")

关键点解析

detections_to_yolo_annotations函数：这个函数负责将检测结果转换为YOLO格式的文本行列表。它接收两个关键参数：
- detections：包含预测框、置信度和类别信息的检测结果
- image_shape：原始图像的尺寸，用于坐标归一化
坐标归一化：YOLO格式要求边界框坐标是相对于图像宽高的归一化值（0-1之间），转换过程会自动完成这一计算。
文件保存：最终生成的文本文件每行格式为：class_id center_x center_y width height