pydicom与highdicom处理WSI图像时像素强度差异问题分析

2025-07-05 17:35:36作者：毕习沙Eudora

概述

在医学影像处理领域，使用pydicom和highdicom库处理全切片图像(WSI)时，开发者可能会遇到像素强度表现不一致的问题。本文深入分析这一现象的技术原因，并提供解决方案。

问题现象

当开发者使用pydicom直接读取DICOM文件的像素数组时，与通过highdicom的ImageFileReader读取的图像相比，虽然数据来源相同，但图像对比度表现存在明显差异：

pydicom读取的图像对比度较高
highdicom读取的图像对比度较低
这种差异会影响后续的模型训练效果

技术原因分析

像素数据处理流程差异

核心差异在于两个库对DICOM像素数据的处理方式不同：

pydicom的默认行为：直接返回原始像素数据，不自动应用任何查找表(LUT)转换
highdicom/ITK的行为：自动应用了DICOM标准定义的模态查找表(modality LUT)和值域查找表(voi LUT)

DICOM标准中的图像表现

医学DICOM图像通常存储两种信息：

原始采集数据：设备直接获取的数值
显示转换参数：如何将这些数值映射到可视化的灰度/彩色空间

临床医生期望看到的图像是经过适当转换后的结果，而非原始数据。

解决方案

方案一：统一应用LUT转换

在使用pydicom时，可以手动应用相同的转换：

from pydicom.pixel_data_handlers import apply_modality_lut, apply_voi_lut

# 读取后应用转换
ds = pydicom.dcmread(filename)
pixel_data = apply_voi_lut(apply_modality_lut(ds.pixel_array, ds), ds)

方案二：使用pydicom的分帧读取功能

对于大尺寸WSI图像，pydicom提供了内存友好的分帧读取方式：

from pydicom.pixels.decoders.base import Decoder

decoder = Decoder(ds)
for frame in decoder.iter_array():
    # 处理单帧数据
    processed_frame = apply_voi_lut(apply_modality_lut(frame, ds), ds)