在nnUNet项目中处理医学影像数据格式转换的技术指南

2025-06-02 03:35:23作者：沈韬淼Beryl

nnUNet

项目地址：https://gitcode.com/gh_mirrors/nn/nnUNet

医学影像分析领域，数据格式转换是一项基础但关键的工作。本文将详细介绍如何在nnUNet项目中，将预处理后的医学影像数据从NPZ格式转换为NIfTI格式，并解决转换过程中可能遇到的方向问题。

数据格式转换基础

在nnUNet项目中，预处理后的数据通常以NPZ格式存储，这是一种NumPy的压缩文件格式。而NIfTI(.nii.gz)则是医学影像领域广泛使用的标准格式，支持元数据存储和多维数组。

基本转换方法

使用Python进行格式转换主要依赖两个库：

NumPy - 用于加载NPZ文件中的数组数据
nibabel/SimpleITK - 用于将数组数据保存为NIfTI格式

最简单的转换代码如下：

import numpy as np
import nibabel as nib

data = np.load('input.npz')
image_array = data["data"][0]
seg_array = data["seg"][0]

affine = np.eye(4)  # 单位矩阵作为仿射变换
nifti_img = nib.Nifti1Image(image_array, affine)
nifti_seg = nib.Nifti1Image(seg_array, affine)

nib.save(nifti_img, 'output_image.nii.gz')
nib.save(nifti_seg, 'output_seg.nii.gz')

处理多模态数据

实际应用中，医学影像往往包含多个模态。例如脑肿瘤分割任务通常包含FLAIR、T1w、t1gd和T2w四种模态。处理这类数据时，需要分别保存每个模态：

modalities = ['FLAIR', 'T1w', 't1gd', 'T2w']
for i, modality in enumerate(modalities):
    if i < modalities_data.shape[0]:
        nifti_img = nib.Nifti1Image(modalities_data[i], affine)
        nib.save(nifti_img, f"{base_name}_{modality}.nii.gz")

解决方向问题

使用nibabel转换时，可能会遇到图像方向不正确的问题。这是因为nibabel对数组轴的排序方式与医学影像标准不同。解决方案是改用SimpleITK：

import SimpleITK as sitk

nifti_img = sitk.GetImageFromArray(modalities_data[i])
sitk.WriteImage(nifti_img, 'output_image.nii.gz')

nifti_seg = sitk.GetImageFromArray(seg_data.astype(np.uint8))
sitk.WriteImage(nifti_seg, 'output_seg.nii.gz')

SimpleITK能更好地保持医学影像的原始方向信息。