MONAI项目中SaveImage变换功能的输入输出映射增强方案

2025-06-03 10:28:06作者：卓艾滢Kingsley

背景与需求分析

在医学影像分析领域，深度学习模型的输入输出文件管理是一个重要但常被忽视的环节。特别是在批量处理场景下，如器官分割任务中，如何清晰地追踪原始影像与生成的分割结果之间的对应关系，对于后续的质量控制、结果验证和科研分析都至关重要。

技术挑战

传统医学影像处理流程中，输入输出文件的映射关系通常通过文件命名约定或目录结构隐式表达。这种方式存在几个明显缺陷：

当处理大量文件时，人工核对效率低下
缺乏标准化的记录格式
在多阶段处理流程中难以追溯完整的数据流

MONAI的解决方案设计

MONAI框架团队针对这一需求，提出了在SaveImage变换中增强输入输出映射记录功能的方案。核心设计要点包括：

1. JSON格式映射文件

采用轻量级的JSON格式存储映射关系，具有以下优势：

良好的可读性
广泛的语言支持
结构化存储能力

2. 动态更新机制

实现了一个智能的记录更新函数，能够：

自动创建初始记录文件
增量式更新记录内容
正确处理多次保存操作

3. 数据结构设计

映射记录采用数组结构，每个元素包含：

image字段：存储输入文件路径数组
label字段：存储输出文件路径数组这种设计预留了多输入多输出的扩展空间。

实现细节

关键实现函数采用了原子化操作设计：

def update_json(self, input_file=None, output_file=None):
    record_path = "img-label.json"
    
    # 处理空文件情况
    if not os.path.exists(record_path) or os.stat(record_path).st_size == 0:
        with open(record_path, 'w') as f:
            json.dump([], f)
    
    # 读写操作
    with open(record_path, 'r+') as f:
        records = json.load(f)
        if input_file:
            new_record = {"image": input_file, "label": []}
            records.append(new_record)
        elif output_file and records:
            records[-1]["label"].append(output_file)
        
        f.seek(0)
        json.dump(records, f, indent=4)