Google Cloud Secret Manager 后端

本主题介绍了如何配置 Airflow 以使用 Secret Manager 作为密钥后端以及如何管理密钥。

开始之前

在开始之前,请确保您已执行以下任务

  1. google 子包作为 Airflow 安装的额外内容包含

    pip install apache-airflow[google]
    
  2. 为每个项目配置 Secret Manager 和您的本地环境

启用密钥后端

要启用 Google Cloud Secrets Manager 的密钥后端以检索连接/变量,请在 airflow.cfg[secrets] 部分中将 CloudSecretManagerBackend 指定为 backend

以下是您想要使用它的示例配置

[secrets]
backend = airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend

您也可以使用环境变量进行设置。

export AIRFLOW__SECRETS__BACKEND=airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend

您可以使用 airflow config get-value 命令验证配置选项的正确设置。

$ airflow config get-value secrets backend
airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend

后端参数

下一步是使用 backend_kwargs 选项配置后端参数。您可以传递以下参数

  • connections_prefix:指定读取以获取连接的密钥的前缀。默认值:"airflow-connections"

  • variables_prefix:指定读取以获取变量的密钥的前缀。默认值:"airflow-variables"

  • gcp_key_path:Google Cloud Service Account Key 文件 (JSON) 的路径。

  • gcp_keyfile_dict:密钥文件参数的字典。

  • gcp_credential_config_file:GCP 凭据配置文件的文件路径或内容。

  • gcp_scopes:包含 OAuth2 范围的逗号分隔的字符串。

  • sep:用于连接 connections_prefix 和 conn_id 的分隔符。默认值:"-"

  • project_id:从中读取密钥的项目 ID。如果未传递,将使用凭据中的项目 ID。

  • impersonation_chain:可选的服务帐户,用于使用短期凭据模拟,或用于获取列表中最后一个帐户的访问令牌的链式帐户列表,该访问令牌将在请求中模拟。

所有选项都应作为 JSON 字典传递。

例如,如果您想将参数 connections_prefix 设置为 "example-connections-prefix",并将参数 variables_prefix 设置为 "example-variables-prefix",则您的配置文件应如下所示

[secrets]
backend = airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend
backend_kwargs = {"connections_prefix": "example-connections-prefix", "variables_prefix": "example-variables-prefix"}

此外,如果您正在使用应用程序默认凭据 (ADC) 从 example-project 读取密钥,但想要模拟其他服务帐户,则您的配置应与此类似

[secrets]
backend = airflow.providers.google.cloud.secrets.secret_manager.CloudSecretManagerBackend
backend_kwargs = {"project_id": "example-project", "impersonation_chain": "impersonated_account@example_project.iam.gserviceaccount.com"}

设置凭据

您可以通过三种方式配置凭据

  • 默认情况下,使用应用程序默认凭据 (ADC) 获取凭据。

  • backend_kwargs 选项中的 gcp_key_path 选项 - 允许您使用存储在本地文件中的服务帐户配置授权。

  • backend_kwargs 选项中的 gcp_keyfile_dict 选项 - 允许您使用存储在 Airflow 配置中的服务帐户配置授权。

  • backend_kwargs 选项中的 gcp_credential_config_file 选项 - 允许您使用凭据配置文件配置身份验证。凭据配置文件是一个配置文件,通常包含非敏感元数据,以指示 google-auth 库如何检索外部主题令牌并将其交换为服务帐户访问令牌。

注意

有关应用程序默认凭据 (ADC) 的更多信息,请参阅

管理密钥

如果要配置连接,则需要将其保存为 连接 URI 表示形式。变量应保存为纯文本。

为了管理密钥,您可以使用 gcloud 工具或其他受支持的工具。有关更多信息,请查看:Google Cloud 文档中的管理密钥

密钥的名称必须符合以下格式

  • 对于连接:[connections_prefix][sep][connection_name]

  • 对于变量:[variables_prefix][sep][variable_name]

  • 对于 Airflow 配置:[config_prefix][sep][config_name]

其中

  • connections_prefix - 在后端配置的 connections_prefix 参数中定义的固定值。默认值:airflow-connections

  • variables_prefix - 在后端配置的 variables_prefix 参数中定义的固定值。默认值:airflow-variables

  • config_prefix - 在后端配置的 config_prefix 参数中定义的固定值。默认值:airflow-config

  • sep - 在后端配置的 sep 参数中定义的固定值。默认值:-

Cloud Secrets Manager 密钥名称应遵循模式 ^[a-zA-Z0-9-_]*$

如果您具有默认的后端配置,并且想要创建一个 conn_id 等于 first-connection 的连接,则应创建一个名为 airflow-connections-first-connection 的密钥。您可以使用 gcloud 工具执行此操作,如下例所示。

$ echo "mysql://example.org" | gcloud beta secrets create \
    airflow-connections-first-connection \
    --data-file=- \
    --replication-policy=automatic
Created version [1] of the secret [airflow-connections-first-connection].

如果您具有默认的后端配置,并且想要创建一个名为 first-variable 的变量,则应创建一个名为 airflow-variables-first-variable 的密钥。您可以使用 gcloud 命令执行此操作,如下例所示。

$ echo "secret_content" | gcloud beta secrets create \
    airflow-variables-first-variable \
    --data-file=-\
    --replication-policy=automatic
Created version [1] of the secret [airflow-variables-first-variable].

注意

如果仅应隐藏连接的密钥,可以选择仅将该密钥存储在 Cloud Secret Manager 中,而不存储整个连接。有关更多详细信息,请查看Google Cloud 连接

检查配置

您可以使用 airflow connections get 命令检查是否已从后端密钥正确读取连接

$ airflow connections get first-connection
Id: null
Connection Id: first-connection
Connection Type: mysql
Host: example.org
Schema: ''
Login: null
Password: null
Port: null
Is Encrypted: null
Is Extra Encrypted: null
Extra: {}
URI: mysql://example.org

要检查是否已从后端密钥正确读取变量,您可以使用 airflow variables get

$ airflow variables get first-variable
secret_content

清理

为了避免因本指南中使用的资源而导致您的 Google Cloud 帐户产生费用,请运行 gcloud beta secrets delete 删除密钥

gcloud beta secrets delete airflow-connections-first-connection
gcloud beta secrets delete airflow-variables-first-variable

此条目是否对您有帮助?