Azure Health Deidentification 1.0.0 版本发布：医疗数据去标识化能力升级

2025-06-12 20:03:23作者：凌朦慧Richard

azure-sdk-for-python

This repository is for active development of the Azure SDK for Python. For consumers of the SDK we recommend visiting our public developer docs at https://learn.microsoft.com/python/azure/ or our versioned developer docs at https://azure.github.io/azure-sdk-for-python.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-sdk-for-python

Azure Health Deidentification 是 Azure SDK for Python 中专注于医疗健康数据隐私保护的组件，它为开发者提供了强大的去标识化功能，能够帮助医疗机构和健康科技公司安全地处理包含敏感信息的医疗数据。最新发布的 1.0.0 版本标志着该组件进入稳定阶段，带来了一系列重要的功能增强和接口优化。

核心功能改进

1. 定制化选项模型重构

新版本引入了两个重要的定制化选项模型：

DeidentificationCustomizationOptions：用于单次文本去标识化操作的配置
DeidentificationJobCustomizationOptions：用于批量文档处理任务的配置

这两个模型新增了 surrogate_locale 字段，允许开发者指定替代文本的区域设置，这对于国际化应用场景尤为重要。同时，将原本独立的 redaction_format 字段整合到这些模型中，使配置更加集中和一致。

2. 存储位置控制增强

在 TargetStorageLocation 模型中新增了 overwrite 属性，这一改进解决了实际业务中常见的需求——当目标位置已存在同名文档时，开发者现在可以明确选择是否覆盖现有文件，为数据管道提供了更灵活的控制能力。

重大变更与迁移指南

1. 客户端方法重命名

为了更准确地反映方法功能，DeidentificationClient 中的方法名称进行了调整：

deidentify → deidentify_text：更明确地表示这是针对文本内容的操作
begin_create_job → begin_deidentify_documents：更清晰地表达这是文档批量处理任务

2. 模型属性优化

多个模型的属性名称进行了调整以提高一致性：

DeidentificationContent.operation → operation_type
DeidentificationDocumentDetails.input → input_location
DeidentificationDocumentDetails.output → output_location
DeidentificationJob.name → job_name
DeidentificationJob.operation → operation_type

这些变更使属性命名更加语义化，便于开发者理解和使用。

3. 状态模型重构

将 OperationState 重命名为 OperationStatus，这一变更使模型名称更符合常规的命名约定，与大多数 Azure 服务的状态表示方式保持一致。

4. 存储路径表示方式统一

在 SourceStorageLocation 和 TargetStorageLocation 中，将 path 字段统一改为 location，这一变更消除了术语上的歧义，使接口更加一致。

实际应用建议

对于医疗健康领域的开发者，升级到 1.0.0 版本时需要注意以下几点：

批量处理任务：新的 outputPrefix 行为不再默认包含 job_name，开发者需要根据实际需求调整输出路径的构建逻辑。
结果处理：TaggerResult 模型中的 path 和 location 已被弃用，建议开发者检查相关代码并更新为使用新推荐的属性。
国际化支持：利用新增的 surrogate_locale 字段可以更好地处理多语言医疗数据，确保替代文本符合目标用户的语言习惯。

这一版本的发布标志着 Azure Health Deidentification 组件在医疗数据隐私保护领域的成熟，为开发者提供了更加稳定、一致的 API 接口，同时增强了灵活性和控制能力，是构建符合 HIPAA 等医疗隐私法规应用的重要工具。

azure-sdk-for-python

This repository is for active development of the Azure SDK for Python. For consumers of the SDK we recommend visiting our public developer docs at https://learn.microsoft.com/python/azure/ or our versioned developer docs at https://azure.github.io/azure-sdk-for-python.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-sdk-for-python

登录后查看全文

项目优选

收起

Ascend Extension for PyTorch

本项目是CANN提供的数学类基础计算算子库，实现网络在NPU上加速计算。

openEuler内核是openEuler操作系统的核心，既是系统性能与稳定性的基石，也是连接处理器、设备与服务的桥梁。

华为昇腾面向大规模分布式训练的多模态大模型套件，支撑多模态生成、多模态理解。

Claude Code 的开源替代方案。连接任意大模型，编辑代码，运行命令，自动验证 — 全自动执行。用 Rust 构建，极致性能。｜ An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get Started

flutter_flutter

Oohos_react_native

React Native鸿蒙化仓库

昇腾LLM分布式训练框架

🎉 (RuoYi)官方仓库基于SpringBoot，Spring Security，JWT，Vue3 & Vite、Element Plus 的前后端分离权限管理系统