nnUNet项目中区域训练与模型集成的问题分析与解决方案

2025-06-02 09:54:47作者：柏廷章Berta

项目地址：https://gitcode.com/gh_mirrors/nn/nnUNet

背景介绍

在医学图像分割领域，nnUNet作为当前最先进的自动分割框架，被广泛应用于各种复杂的医学图像分割任务。其中，区域训练(Region-based training)是nnUNet提供的一种高级功能，特别适用于需要处理层次化标签结构的复杂分割任务，如心肌瘢痕和水肿的分割。

问题现象

用户在使用nnUNet进行两阶段分割任务时发现了一个重要现象：在粗分割阶段，2D和3D模型的集成效果良好，能够提升整体性能；但在细分割阶段（使用区域训练），虽然单个模型的评估指标正常，但模型集成后的性能却出现了断崖式下降，Dice系数从0.85骤降至0.02左右。

问题根源分析

经过深入的技术排查，发现这一问题源于区域训练模式下模型集成过程中的重复非线性变换：

第一次非线性变换：在保存预测结果(.npz文件)时，label_manager.apply_inference_nonlin已经对原始logits进行了sigmoid变换，将输出转换为概率图。
第二次非线性变换：在模型集成阶段(merge_files函数)，label_manager.convert_logits_to_segmentation内部再次调用了apply_inference_nonlin，导致对已经sigmoid变换过的概率图再次进行sigmoid变换。

这种双重变换使得最终的概率值被过度压缩，导致阈值判断(默认0.5)几乎无法正确识别任何区域，从而造成集成性能的异常下降。

解决方案

针对这一问题，提出了以下技术解决方案：

临时修改非线性变换：在区域训练模式的集成过程中，将inference_nonlin临时替换为恒等函数(identity function)，避免重复变换。
具体实现方式：在merge_files函数中添加条件判断，当检测到区域训练模式时，临时修改非线性变换函数：

def identity_function(logits: torch.Tensor) -> torch.Tensor:
    return logits

if label_manager.has_regions:
    label_manager.inference_nonlin = identity_function
    segmentation = label_manager.convert_logits_to_segmentation(probabilities)