Detectron2训练过程中"gt_masks"字段缺失问题分析与解决方案

2025-05-04 23:09:12作者：伍霜盼Ellen

问题背景

在使用Facebook Research开发的Detectron2目标检测框架进行模型训练时，开发者可能会遇到一个常见的错误："AttributeError: Cannot find field 'gt_masks' in the given Instances!"。这个问题通常出现在配置自定义训练流程时，特别是在处理数据增强和数据加载环节。

错误原因分析

该错误的根本原因在于数据预处理流程中设置了recompute_boxes=True选项，但输入数据中缺少必要的掩码(mask)信息。具体来说：

当启用recompute_boxes选项时，数据加载器会尝试通过实例分割掩码(gt_masks)重新计算更精确的边界框，这在图像经过裁剪等空间变换后特别有用。
然而，对于纯目标检测任务(只有边界框标注而没有实例分割标注)的数据集，实例对象中自然不会包含gt_masks字段，导致系统抛出异常。
在Detectron2的默认实现中，DatasetMapper会先检查是否存在gt_masks，如果存在则使用掩码重新计算边界框，否则直接变换原有的边界框坐标。

解决方案

针对这一问题，开发者可以采取以下几种解决方案：

方案一：禁用recompute_boxes选项

最直接的解决方法是关闭recompute_boxes功能。在配置文件中设置：

dataloader.train.mapper.recompute_boxes = False

或者在自定义DatasetMapper时不传递recompute_boxes=True参数。

方案二：确保数据标注完整性

如果确实需要重新计算边界框的功能，可以考虑：

为训练数据添加伪掩码标注，即根据边界框生成对应的矩形掩码。
使用第三方工具将边界框标注转换为简单的矩形掩码。

方案三：自定义数据预处理逻辑

对于高级用户，可以继承DatasetMapper类并重写_transform_annotations方法，实现不依赖掩码的边界框重计算逻辑：

class CustomDatasetMapper(DatasetMapper):
    def _transform_annotations(self, dataset_dict, transforms, image_shape):
        # 自定义的边界框处理逻辑
        ...