Microsoft Azure 数据工厂¶
Microsoft Azure 数据工厂连接类型启用 Azure 数据工厂集成。
向 Azure 数据工厂进行身份验证¶
使用 Airflow 连接到 Azure 数据工厂有三种方法。
使用令牌凭据,即向 Airflow 连接添加特定凭据(client_id、secret、tenant)和订阅 ID。
通过设置
managed_identity_client_id
、workload_identity_tenant_id
(在钩子下,它使用DefaultAzureCredential和这些参数)使用托管标识回退到DefaultAzureCredential。这包括尝试不同选项以进行身份验证的机制:托管系统标识、环境变量、通过 Azure CLI 进行身份验证…
默认连接 ID¶
所有与 Microsoft Azure 数据工厂相关的钩子和操作符默认使用 azure_data_factory_default
。
配置连接¶
- 客户端 ID
指定用于初始连接的
client_id
。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential。- 密码
指定用于初始连接的
secret
。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential。- 租户 ID
指定用于初始连接的 Azure 租户 ID。这是 令牌凭据 认证机制所必需的。可以将其留空以退回到 DefaultAzureCredential。使用额外参数
tenantId
传入租户 ID。- 订阅 ID
指定用于初始连接的订阅 ID。这是所有认证机制所必需的。使用额外参数
subscriptionId
传入 Azure 订阅 ID。- 工厂名称(可选)
指定要与之交互的 Azure 数据工厂。如果未在连接中指定,则需要将其直接传递到钩子、操作符和传感器。使用额外参数
factory_name
传入工厂名称。- 资源组名称(可选)
指定所需数据工厂所在的 Azure 资源组名称。如果未在连接中指定,则需要直接将其传递给钩子、运算符和传感器。使用额外的参数
resource_group_name
传递资源组名称。- 托管标识客户端 ID(可选)
用户分配的托管标识的客户端 ID。如果与
workload_identity_tenant_id
一起提供,它们将传递给 DefaultAzureCredential。- 工作负载标识租户 ID(可选)
应用程序的 Microsoft Entra 租户 ID。也称为其“目录”ID。如果与
managed_identity_client_id
一起提供,它们将传递给 DefaultAzureCredential。
在环境变量中指定连接时,应使用 URI 语法指定它。
请注意,URI 的所有组件都应进行 URL 编码。
示例¶
export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id&resource_group_name=group+name&factory_name=factory+name'
export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id'