X-AnyLabeling项目中YOLO格式导出问题的分析与解决方案

2025-06-08 23:45:59作者：田桥桑Industrious

问题背景

在使用X-AnyLabeling进行图像标注时，部分用户遇到了导出YOLO格式时出现坐标值大于1的问题。经过分析，这主要是由于图像尺寸参数在JSON文件中被错误记录导致的。具体表现为：当图像实际尺寸为1440×2560时，JSON文件中却记录为2560×1440，导致归一化后的坐标值超出合理范围。

问题根源

YOLO格式要求所有边界框坐标必须归一化到0-1之间，这是通过将绝对坐标除以图像宽度或高度实现的。当图像尺寸参数被错误记录时，归一化计算就会出现偏差：

对于宽度坐标(x)，本应除以1440，却错误地除以了2560
对于高度坐标(y)，本应除以2560，却错误地除以了1440

这种尺寸参数的颠倒导致了归一化后的坐标值超出正常范围，严重影响后续模型训练的效果。

解决方案

针对这一问题，X-AnyLabeling项目团队已经在新版本中进行了修复。建议用户采取以下措施：

升级到最新版本：项目团队表示该问题在半年前的版本中已修复，建议用户及时更新软件
数据兼容性处理：对于已经使用旧版本标注的数据，可以通过以下Python代码进行兼容性处理：

# 处理旧版本两点式矩形标注
if len(points) == 2:
    # 转换为四点式标注（左上、右上、右下、左下）
    rect_coords = [
        points[0],  # 左上角
        [points[1][0], points[0][1]],  # 右上角
        points[1],  # 右下角
        [points[0][0], points[1][1]]  # 左下角
    ]
    points = rect_coords

数据验证：导出YOLO格式后，建议检查生成的TXT文件，确认所有坐标值都在0-1范围内

技术细节解析

X-AnyLabeling在版本迭代中对矩形标注的表示方式进行了优化：

旧版本：使用两点表示法（左上角和右下角坐标）
新版本：统一使用四点表示法（顺时针方向的四个角点坐标）

这种改变提高了标注数据的规范性和兼容性，但需要注意新旧版本之间的转换。在YOLO格式转换过程中，核心计算公式如下：

# 计算归一化中心坐标
x_center = (points[0][0] + points[2][0]) / (2 * image_width)
y_center = (points[0][1] + points[2][1]) / (2 * image_height)

# 计算归一化宽度和高度
width = abs(points[2][0] - points[0][0]) / image_width
height = abs(points[2][1] - points[0][1]) / image_height