CleanLab项目中处理目标检测空预测的技术实践

2025-05-22 01:56:43作者：盛欣凯Ernestine

在目标检测任务中，处理空预测（即模型未检测到任何目标的情况）是一个常见但容易被忽视的技术细节。本文将深入探讨在使用CleanLab进行目标检测数据质量分析时，如何正确处理空预测的技术方案。

问题背景

在目标检测任务中，模型有时会对某些图像不产生任何预测结果（空预测）。这种情况在CleanLab等数据质量分析工具中需要特殊处理，因为工具通常期望接收特定格式的预测结果。

常见错误处理方式

许多开发者初次尝试时，可能会采用以下错误方式处理空预测：

使用空列表[]表示无预测
使用特定形状的零数组如[1, 1, 0]填充
完全忽略空预测情况

这些方法往往会导致CleanLab工具运行时出现各种错误，因为它们不符合工具对输入数据格式的预期要求。

正确解决方案

CleanLab要求目标检测的预测结果采用特定的数据结构。对于空预测情况，正确的处理方式应该是：

初始化预测容器：为每个类别预先分配一个空的NumPy数组，形状为(0, 5)，其中5表示[x1, y1, x2, y2, confidence]五个值
处理预测结果：
- 对于每个检测到的目标，将其坐标转换为[x1, y1, x2, y2]格式
- 将每个检测结果及其置信度组合成形状为(1, 5)的数组
- 使用np.vstack将新检测结果与已有结果合并
最终格式：将所有类别的预测结果组合成一个NumPy对象数组

实现示例

以下是经过验证的正确实现代码：

def format_predictions(self, img_path, formatted_predictions):
    # 获取模型预测结果
    pred = self.model.predict(source=img_path, conf=0.4, iou=0.4)[0]
    
    # 初始化预测容器：每个类别一个(0,5)数组
    bboxes = [np.zeros((0, 5), dtype=np.float32) for _ in range(self.all_classes)]
    
    # 处理每个检测框
    for box in pred.boxes:
        cls = box.cls.int().cpu().numpy().tolist()[0]
        confidence = box.conf.cpu().numpy().tolist()[0]
        x, y, w, h = box.xywh.cpu().numpy().tolist()[0]
        
        # 转换为[x1,y1,x2,y2]格式
        x1, y1, x2, y2 = self._xywh2ltrb([x, y, w, h], to_abs=False)
        
        # 创建当前检测框数组
        current_box = np.array([[x1, y1, x2, y2, confidence]], dtype=np.float32)
        
        # 合并到对应类别的预测中
        if bboxes[cls].size > 0:
            bboxes[cls] = np.vstack([bboxes[cls], current_box])
        else:
            bboxes[cls] = current_box
    
    # 添加到最终预测列表
    formatted_predictions.append(np.array(bboxes, dtype=object))