Azure Health Deidentification 1.0.0 版本发布:医疗数据去标识化能力升级
Azure Health Deidentification 是 Azure SDK for Python 中专注于医疗健康数据隐私保护的组件,它为开发者提供了强大的去标识化功能,能够帮助医疗机构和健康科技公司安全地处理包含敏感信息的医疗数据。最新发布的 1.0.0 版本标志着该组件进入稳定阶段,带来了一系列重要的功能增强和接口优化。
核心功能改进
1. 定制化选项模型重构
新版本引入了两个重要的定制化选项模型:
DeidentificationCustomizationOptions:用于单次文本去标识化操作的配置DeidentificationJobCustomizationOptions:用于批量文档处理任务的配置
这两个模型新增了 surrogate_locale 字段,允许开发者指定替代文本的区域设置,这对于国际化应用场景尤为重要。同时,将原本独立的 redaction_format 字段整合到这些模型中,使配置更加集中和一致。
2. 存储位置控制增强
在 TargetStorageLocation 模型中新增了 overwrite 属性,这一改进解决了实际业务中常见的需求——当目标位置已存在同名文档时,开发者现在可以明确选择是否覆盖现有文件,为数据管道提供了更灵活的控制能力。
重大变更与迁移指南
1. 客户端方法重命名
为了更准确地反映方法功能,DeidentificationClient 中的方法名称进行了调整:
deidentify→deidentify_text:更明确地表示这是针对文本内容的操作begin_create_job→begin_deidentify_documents:更清晰地表达这是文档批量处理任务
2. 模型属性优化
多个模型的属性名称进行了调整以提高一致性:
DeidentificationContent.operation→operation_typeDeidentificationDocumentDetails.input→input_locationDeidentificationDocumentDetails.output→output_locationDeidentificationJob.name→job_nameDeidentificationJob.operation→operation_type
这些变更使属性命名更加语义化,便于开发者理解和使用。
3. 状态模型重构
将 OperationState 重命名为 OperationStatus,这一变更使模型名称更符合常规的命名约定,与大多数 Azure 服务的状态表示方式保持一致。
4. 存储路径表示方式统一
在 SourceStorageLocation 和 TargetStorageLocation 中,将 path 字段统一改为 location,这一变更消除了术语上的歧义,使接口更加一致。
实际应用建议
对于医疗健康领域的开发者,升级到 1.0.0 版本时需要注意以下几点:
-
批量处理任务:新的
outputPrefix行为不再默认包含job_name,开发者需要根据实际需求调整输出路径的构建逻辑。 -
结果处理:
TaggerResult模型中的path和location已被弃用,建议开发者检查相关代码并更新为使用新推荐的属性。 -
国际化支持:利用新增的
surrogate_locale字段可以更好地处理多语言医疗数据,确保替代文本符合目标用户的语言习惯。
这一版本的发布标志着 Azure Health Deidentification 组件在医疗数据隐私保护领域的成熟,为开发者提供了更加稳定、一致的 API 接口,同时增强了灵活性和控制能力,是构建符合 HIPAA 等医疗隐私法规应用的重要工具。
atomcodeClaude Code 的开源替代方案。连接任意大模型,编辑代码,运行命令,自动验证 — 全自动执行。用 Rust 构建,极致性能。 | An open-source alternative to Claude Code. Connect any LLM, edit code, run commands, and verify changes — autonomously. Built in Rust for speed. Get StartedRust0151- DDeepSeek-V4-ProDeepSeek-V4-Pro(总参数 1.6 万亿,激活 49B)面向复杂推理和高级编程任务,在代码竞赛、数学推理、Agent 工作流等场景表现优异,性能接近国际前沿闭源模型。Python00
LongCat-Video-Avatar-1.5最新开源LongCat-Video-Avatar 1.5 版本,这是一款经过升级的开源框架,专注于音频驱动人物视频生成的极致实证优化与生产级就绪能力。该版本在 LongCat-Video 基础模型之上构建,可生成高度稳定的商用级虚拟人视频,支持音频-文本转视频(AT2V)、音频-文本-图像转视频(ATI2V)以及视频续播等原生任务,并能无缝兼容单流与多流音频输入。00
auto-devAutoDev 是一个 AI 驱动的辅助编程插件。AutoDev 支持一键生成测试、代码、提交信息等,还能够与您的需求管理系统(例如Jira、Trello、Github Issue 等)直接对接。 在IDE 中,您只需简单点击,AutoDev 会根据您的需求自动为您生成代码。Kotlin03
Intern-S2-PreviewIntern-S2-Preview,这是一款高效的350亿参数科学多模态基础模型。除了常规的参数与数据规模扩展外,Intern-S2-Preview探索了任务扩展:通过提升科学任务的难度、多样性与覆盖范围,进一步释放模型能力。Python00
skillhubopenJiuwen 生态的 Skill 托管与分发开源方案,支持自建与可选 ClawHub 兼容。Python0112