Sapiens项目中深度图与法线图的棋盘格伪影问题解析

2025-06-10 00:37:43作者：邬祺芯Juliet

在计算机视觉和三维重建领域，棋盘格伪影（Checkerboard Artifacts）是深度学习模型输出中常见的干扰现象。本文将以Facebook Research的Sapiens项目为背景，深入分析该问题产生的原因及解决方案。

伪影现象特征

棋盘格伪影主要表现为在模型输出的深度图或法线图上出现规则的网格状噪声，这种噪声会严重影响后续的三维重建或场景理解效果。在Sapiens项目中，这类伪影通常出现在以下两种情况下：

伪影产生的根本原因在于上采样过程中的不均匀重叠。当使用转置卷积或反卷积进行上采样时，输出像素会受到输入特征图中不同位置的影响，导致相邻像素之间存在不一致性。这种不一致性在视觉上表现为棋盘格模式。

具体来说，反卷积操作中的"重叠-相加"过程会引入高频噪声。当上采样倍数较大时，这种噪声会被放大，形成明显的棋盘格图案。这种现象在深度估计和法线预测任务中尤为明显，因为这些输出本身就需要保持高度的空间一致性。

针对Sapiens项目中的伪影问题，开发者提出了以下技术建议：

后处理平滑滤波：对模型原始输出应用高斯滤波或双边滤波，可以有效减轻伪影。这种方法计算成本低，但可能会损失部分细节。
模型架构改进：从模型设计层面考虑，可以采用以下方法：
- 使用双线性上采样代替转置卷积
- 引入亚像素卷积(Sub-pixel Convolution)
- 添加正则化项约束输出平滑性
多尺度融合：通过融合不同尺度的特征图，可以减少单一上采样操作带来的伪影。