nnUNet中基于区域训练与标签训练的性能评估对比

2025-06-01 00:58:28作者：段琳惟

背景介绍

在医学图像分割领域，nnUNet作为当前最先进的框架之一，提供了多种训练策略。其中基于区域(region-based)的训练方法与传统的基于标签(label-based)训练方法在性能评估上存在显著差异，这常常让研究人员感到困惑。

在BraTS数据集这样的多类分割任务中，nnUNet的区域训练策略将标签组合成不同的区域层次：

而传统方法则直接对每个独立标签(1、2、3)进行训练和评估。这种差异导致了两者在性能指标上的不可直接比较性。

当从区域预测结果重构原始标签时，观察到的Dice分数通常会低于区域级别的分数，这主要由以下因素造成：

体积效应：较大的区域包含更多内部体素，这些体素相对容易预测准确。例如，CE+Necrosis(2,3)区域比单独的CE(1)区域体积更大，因此Dice分数自然更高。
边界难度：小体积结构(如CE)的边界预测难度较大，而大体积结构内部区域预测相对简单。
层级累积误差：在从精细区域重构原始标签时，误差会逐层累积，导致最终标签级别的性能下降。

nnUNet的区域训练策略与传统的标签训练在性能评估上存在本质差异。研究人员应当理解这种差异的成因，并根据实际需求选择合适的评估方式。区域训练虽然可能导致重构后的标签级指标下降，但这种下降反映了医学图像分割中不同结构的固有难度差异，而非方法缺陷。

登录后查看全文