Azure数据工厂管理库9.2.0版本新特性解析

2025-06-12 01:39:23作者：羿妍玫Ivan

This repository is for active development of the Azure SDK for Python. For consumers of the SDK we recommend visiting our public developer docs at https://learn.microsoft.com/python/azure/ or our versioned developer docs at https://azure.github.io/azure-sdk-for-python.

项目地址：https://gitcode.com/GitHub_Trending/az/azure-sdk-for-python

Azure数据工厂是微软提供的一项云数据集成服务，用于创建、调度和管理数据工作流。azure-mgmt-datafactory是Azure SDK for Python中用于管理数据工厂资源的官方库。最新发布的9.2.0版本带来了多项重要更新，主要增强了多种数据连接器的功能和配置选项。

核心更新内容

1. 数据连接器认证增强

新版本对多个数据连接器的认证方式进行了显著增强：

Azure PostgreSQL连接器：新增了Azure云类型配置、服务主体凭证类型支持，以及服务主体嵌入式证书认证功能。这使得用户可以使用更安全的服务主体认证方式而非传统的用户名密码。
Greenplum连接器：增加了完整的认证类型配置，支持SSL模式设置，并提供了连接超时和命令超时等精细化控制参数。
Oracle连接器：引入了丰富的安全配置选项，包括客户端加密类型、校验和类型设置，以及批量加载支持等企业级功能。

2. 数据写入功能优化

针对数据写入场景，新版本提供了更多控制选项：

Azure PostgreSQL Sink：新增了upsert设置和写入方法配置，允许更灵活地处理目标表中已存在的数据。
Dynamics相关Sink：增加了绕过业务逻辑执行和Power Automate流程的选项，这在需要直接操作底层数据而不触发业务流程时非常有用。

3. 数据类型转换增强

TypeConversionSettings类新增了日期和时间格式的配置选项，使得在不同系统间迁移数据时能够更精确地控制时间类型数据的转换方式。

技术细节深入

认证安全增强

新版本中，多个连接器都增加了服务主体认证支持。以Azure PostgreSQL为例，现在可以通过以下方式配置认证：

{
    "type": "AzurePostgreSql",
    "typeProperties": {
        "authenticationType": "ServicePrincipal",
        "servicePrincipalId": "<appId>",
        "servicePrincipalCredentialType": "ServicePrincipalKey",
        "servicePrincipalKey": {
            "type": "SecureString",
            "value": "<password>"
        },
        "tenant": "<tenantId>"
    }
}

性能优化参数

Oracle连接器新增的fetchSize和statementCacheSize等参数可以显著影响大数据量场景下的性能表现。合理配置这些参数可以根据具体工作负载优化内存使用和查询效率。

数据一致性控制

新增的upsert设置允许在PostgreSQL目标表中智能地处理冲突数据，结合writeMethod配置，可以实现"插入新记录，更新已存在记录"的混合操作模式。

升级建议

对于正在使用以下功能的用户，建议优先考虑升级：

需要更安全认证方式连接PostgreSQL或Oracle数据库的场景
需要精细控制Dynamics数据写入流程的业务
处理复杂时间格式转换需求的ETL任务

升级时应注意测试新增参数的默认值是否满足现有业务流程需求，特别是像fetchSize这样的性能相关参数，可能需要根据具体数据特征进行调整。

总结

azure-mgmt-datafactory 9.2.0版本通过增强多种数据连接器的功能和配置选项，为数据集成工作流提供了更强大、更灵活的控制能力。这些更新特别适合需要高安全性、高性能数据处理的复杂企业场景。开发人员现在可以更精细地控制数据流动的各个环节，从认证安全到写入行为，再到数据类型转换，构建更健壮的数据管道。

azure-sdk-for-python

项目地址：https://gitcode.com/GitHub_Trending/az/azure-sdk-for-python

登录后查看全文