Pointcept项目中PointTransformerV3测试结果异常的分析与解决

2025-07-04 18:46:10作者：温艾琴Wonderful

Pointcept: Perceive the world with sparse points, a codebase for point cloud perception research. Latest works: Utonia (ICML'26), Concerto (NeurIPS'25), Sonata (CVPR'25 Highlight), PTv3 (CVPR'24 Oral)

项目地址：https://gitcode.com/gh_mirrors/po/Pointcept

问题背景

在使用Pointcept项目中的PointTransformerV3（PTv3）模型进行三维点云语义分割任务时，开发者遇到了一个典型问题：在验证集上表现良好的模型（各类别IoU达到80%以上），在测试阶段却出现了特定类别性能急剧下降的情况（从80%降至9%）。这种训练-测试性能不一致的现象在深度学习项目中并不罕见，但在点云处理领域有其特殊性。

现象分析

该问题表现出以下特征：

验证集性能良好，多数类别IoU超过80%
测试时特定类别（样本量最少的类别）IoU骤降至9%
其他类别保持正常表现（约80%）
点云数据密度较高（37点/平方米，每场景约9万点）

可能原因探究

经过技术分析，可能的原因包括：

预处理流程不一致：训练和测试阶段的transform管道配置存在差异，特别是GridSample操作的使用不一致
网格尺寸选择不当：虽然高密度点云（0.25m网格）理论上适合小网格，但可能导致过采样
类别不平衡问题：最少样本类别的性能下降最明显，表明数据分布影响显著
后处理插值问题：预测时false positive过多，插值过程放大了误差

解决方案

通过深入排查，发现问题根源在于测试配置中的transform管道与训练阶段不一致。具体解决方案为：

统一预处理流程：移除测试配置中多余的GridSample操作
对齐管道配置：确保测试管道与训练管道完全一致
简化测试transform：仅保留必要的中心位移操作

修正后的配置如下：

transform=[
    dict(type='CenterShift', apply_z=True)
],
test_mode=True,
test_cfg=dict(
    voxelize=dict(
        type='GridSample',
        grid_size=0.25,
        hash_type='fnv',
        mode='test',
        return_grid_coord=True,
        keys=('coord', 'strength')),
    crop=None,
    post_transform=[
        dict(type='ToTensor'),
        dict(
            type='Collect',
            keys=('coord', 'grid_coord', 'index'),
            feat_keys=('coord', 'strength'))
    ],
    aug_transform=[[{
        'type': 'RandomRotateTargetAngle',
        'angle': [0],
        'axis': 'z',
        'center': [0, 0, 0],
        'p': 1
    }]]),