MONAI项目中PatchInferer与AvgMerger结合使用时的NaN问题分析

2025-06-03 19:14:46作者：咎竹峻Karen

问题背景

在MONAI医学影像分析框架中，PatchInferer是一个常用的推理工具，它通过将大尺寸图像分割成小块(patch)进行处理，然后再将结果合并回原图尺寸。当PatchInferer与AvgMerger(默认的合并器)结合使用时，如果同时指定了filter_fn(过滤函数)，在某些情况下会导致输出结果中出现NaN(非数值)值。

问题原理

这个问题的根源在于AvgMerger的工作机制。AvgMerger在合并patch时，会维护两个张量：

values张量：存储所有patch值的累加和
counts张量：记录每个位置被累加的次数

在最终合并阶段(finalize方法)，AvgMerger会将values张量除以counts张量来得到平均值。当filter_fn过滤掉某些区域时，这些区域对应的counts值为0，导致除零操作，从而产生NaN。

问题复现

以下是一个简单的复现代码示例：

from monai.inferers.splitter import SlidingWindowSplitter
from monai.inferers.inferer import PatchInferer
import torch 

H,W = 512,512
def filter_fn(x,location):
    if location[1]>H//2:
        return False
    return True
    
splitter = SlidingWindowSplitter(
    (128,128),
    overlap=0,
    offset=0,
    filter_fn=filter_fn
)

inferer = PatchInferer(splitter)
inputs = torch.randn((1,1,H,W))
outputs = inferer(inputs=inputs, network=lambda x: x)

在这个例子中，filter_fn过滤掉了图像下半部分的所有patch，导致这些区域在合并时counts为0，最终输出中对应位置会出现NaN。

解决方案探讨

针对这个问题，有几种可能的解决方案：

预处理counts张量：在finalize方法中，可以将counts为0的位置设置为1，这样除法的结果将为0。这种方法简单直接，但可能会掩盖真实的问题。
使用极小值替代：对于被过滤的区域，可以使用torch.finfo(self.values.dtype).min这样的极小值来替代，保持数值连续性。
修改filter_fn逻辑：确保filter_fn不会完全过滤掉某些区域，或者在这些区域提供默认值。
异常处理：在finalize方法中加入对counts为0情况的特殊处理，根据应用场景选择合适的替代值。