Microsoft Azure 数据工厂

Microsoft Azure 数据工厂连接类型启用 Azure 数据工厂集成。

向 Azure 数据工厂进行身份验证

使用 Airflow 连接到 Azure 数据工厂有三种方法。

  1. 使用令牌凭据,即向 Airflow 连接添加特定凭据(client_id、secret、tenant)和订阅 ID。

  2. 通过设置managed_identity_client_idworkload_identity_tenant_id(在钩子下,它使用DefaultAzureCredential和这些参数)使用托管标识

  3. 回退到DefaultAzureCredential。这包括尝试不同选项以进行身份验证的机制:托管系统标识、环境变量、通过 Azure CLI 进行身份验证…

默认连接 ID

所有与 Microsoft Azure 数据工厂相关的钩子和操作符默认使用 azure_data_factory_default

配置连接

客户端 ID

指定用于初始连接的 client_id。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential

密码

指定用于初始连接的 secret。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential

租户 ID

指定用于初始连接的 Azure 租户 ID。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential。使用额外参数 tenantId 传入租户 ID。

订阅 ID

指定用于初始连接的订阅 ID。这是所有认证机制所必需的。使用额外参数 subscriptionId 传入 Azure 订阅 ID。

工厂名称(可选)

指定要与之交互的 Azure 数据工厂。如果未在连接中指定,则需要将其直接传递到钩子、操作符和传感器。使用额外参数 factory_name 传入工厂名称。

资源组名称(可选)

指定所需数据工厂所在的 Azure 资源组名称。如果未在连接中指定,则需要直接将其传递给钩子、运算符和传感器。使用额外的参数 resource_group_name 传递资源组名称。

托管标识客户端 ID(可选)

用户分配的托管标识的客户端 ID。如果与 workload_identity_tenant_id 一起提供,它们将传递给 DefaultAzureCredential

工作负载标识租户 ID(可选)

应用程序的 Microsoft Entra 租户 ID。也称为其“目录”ID。如果与 managed_identity_client_id 一起提供,它们将传递给 DefaultAzureCredential

在环境变量中指定连接时,应使用 URI 语法指定它。

请注意,URI 的所有组件都应进行 URL 编码。

示例

export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id&resource_group_name=group+name&factory_name=factory+name'
export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id'

此条目是否有用?