首页
/ Azure.Health.Deidentification 1.0.0 版本发布:医疗数据去标识化能力升级

Azure.Health.Deidentification 1.0.0 版本发布:医疗数据去标识化能力升级

2025-06-10 06:55:47作者:劳婵绚Shirley

Azure.Health.Deidentification 是微软 Azure SDK for .NET 中的一个重要组件,专注于为医疗健康领域提供专业的数据去标识化(deidentification)功能。在医疗数据处理场景中,去标识化是一项关键的安全措施,它能够移除或替换个人识别信息(PII)和受保护健康信息(PHI),确保数据隐私同时保持数据的可用性。

核心功能增强

本次发布的 1.0.0 版本带来了多项重要改进,主要围绕 API 设计的清晰度和功能完整性展开:

  1. 模型结构优化:新增了 DeidentificationCustomizationOptionsDeidentificationJobCustomizationOptions 两个模型类,将原本分散的配置选项进行了合理归类。其中特别值得注意的是新增了 SurrogateLocale 字段,用于指定替代文本的区域设置,这对于国际化医疗数据处理尤为重要。

  2. 存储控制增强:在 TargetStorageLocation 模型中引入了 Overwrite 标志位,为输出文件的处理提供了更精细的控制能力,用户可以明确指定是否覆盖已存在的输出文件。

API 设计改进

  1. 方法命名规范化:对客户端方法进行了重新命名,使其更准确地反映功能本质。例如将 Deidentify* 系列方法更名为 DeidentifyText*,明确表示这些方法处理的是文本内容;将 CreateJob* 更名为 DeidentifyDocuments*,更直观地表达其文档处理能力。

  2. 属性名称优化:将 DeidentificationContent.Operation 更名为 OperationType,提高了属性名的语义明确性;类似地,DeidentificationJob 模型中的 NameOperation 也分别更名为 JobNameOperationType,使代码可读性得到提升。

  3. 状态模型重构:将 OperationState 更名为 OperationStatus,这一变更虽然微小,但更符合 .NET 生态的命名惯例,使开发者能够更直观地理解其用途。

存储路径处理改进

  1. 路径属性统一:将 SourceStorageLocationTargetStorageLocation 中的 Path 字段统一更名为 Location,提高了 API 的一致性。

  2. 前缀处理简化:调整了 TargetStorageLocation.Prefix 的处理逻辑,现在它仅包含用户显式提供的值,不再自动包含作业名称。这一变更虽然可能影响现有代码,但提供了更可预测的行为,使路径生成逻辑更加透明。

弃用说明

本次版本中标记为弃用的功能将在未来版本中移除,开发者应当及时调整代码:

  1. DocumentDataType 已被标记为弃用,建议开发者寻找替代方案。
  2. TaggerResult 模型中的 PathLocation 属性也被标记为弃用,开发者应当使用模型提供的其他方式来获取相关信息。

升级建议

对于正在使用预览版的开发者,升级到 1.0.0 正式版时需要注意以下几点:

  1. 检查所有调用的方法名称,确保使用了新的命名规范。
  2. 验证所有模型属性的引用,特别是那些被重命名的属性。
  3. 重新评估存储路径生成逻辑,特别是依赖自动添加作业名称的场景。
  4. 替换所有使用已弃用类型和属性的代码。

这次版本升级标志着 Azure.Health.Deidentification 组件进入了稳定阶段,其改进的 API 设计和增强的功能将为医疗健康领域的数据隐私保护提供更加强大和可靠的支持。

登录后查看全文
热门项目推荐
相关项目推荐