Azure.Health.Deidentification 1.0.0 版本发布：医疗数据去标识化能力升级

2025-06-10 06:55:47作者：劳婵绚Shirley

This repository is for active development of the Azure SDK for .NET. For consumers of the SDK we recommend visiting our public developer docs at https://learn.microsoft.com/dotnet/azure/ or our versioned developer docs at https://azure.github.io/azure-sdk-for-net.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-sdk-for-net

Azure.Health.Deidentification 是微软 Azure SDK for .NET 中的一个重要组件，专注于为医疗健康领域提供专业的数据去标识化(deidentification)功能。在医疗数据处理场景中，去标识化是一项关键的安全措施，它能够移除或替换个人识别信息(PII)和受保护健康信息(PHI)，确保数据隐私同时保持数据的可用性。

核心功能增强

本次发布的 1.0.0 版本带来了多项重要改进，主要围绕 API 设计的清晰度和功能完整性展开：

模型结构优化：新增了 DeidentificationCustomizationOptions 和 DeidentificationJobCustomizationOptions 两个模型类，将原本分散的配置选项进行了合理归类。其中特别值得注意的是新增了 SurrogateLocale 字段，用于指定替代文本的区域设置，这对于国际化医疗数据处理尤为重要。
存储控制增强：在 TargetStorageLocation 模型中引入了 Overwrite 标志位，为输出文件的处理提供了更精细的控制能力，用户可以明确指定是否覆盖已存在的输出文件。

API 设计改进

方法命名规范化：对客户端方法进行了重新命名，使其更准确地反映功能本质。例如将 Deidentify* 系列方法更名为 DeidentifyText*，明确表示这些方法处理的是文本内容；将 CreateJob* 更名为 DeidentifyDocuments*，更直观地表达其文档处理能力。
属性名称优化：将 DeidentificationContent.Operation 更名为 OperationType，提高了属性名的语义明确性；类似地，DeidentificationJob 模型中的 Name 和 Operation 也分别更名为 JobName 和 OperationType，使代码可读性得到提升。
状态模型重构：将 OperationState 更名为 OperationStatus，这一变更虽然微小，但更符合 .NET 生态的命名惯例，使开发者能够更直观地理解其用途。

存储路径处理改进

路径属性统一：将 SourceStorageLocation 和 TargetStorageLocation 中的 Path 字段统一更名为 Location，提高了 API 的一致性。
前缀处理简化：调整了 TargetStorageLocation.Prefix 的处理逻辑，现在它仅包含用户显式提供的值，不再自动包含作业名称。这一变更虽然可能影响现有代码，但提供了更可预测的行为，使路径生成逻辑更加透明。