airflow.providers.google.cloud.triggers.dataplex

此模块包含 Google Dataplex 触发器。

模块内容

DataplexDataQualityJobTrigger

DataplexDataQualityJobTrigger 在触发器工作器上运行,并等待作业达到 SUCCEEDED 状态。

DataplexDataProfileJobTrigger

DataplexDataProfileJobTrigger 在触发器工作器上运行,并等待作业达到 SUCCEEDED 状态。

class airflow.providers.google.cloud.triggers.dataplex.DataplexDataQualityJobTrigger(job_id, data_scan_id, project_id, region, gcp_conn_id='google_cloud_default', polling_interval_seconds=10, impersonation_chain=None, **kwargs)[源代码]

基类: airflow.triggers.base.BaseTrigger

DataplexDataQualityJobTrigger 在触发器工作器上运行,并等待作业达到 SUCCEEDED 状态。

参数
  • job_id (str | None) – 可选。Dataplex 作业的 ID。

  • data_scan_id (str) – 必填。DataScan 标识符。

  • project_id (str | None) – 运行作业的 Google Cloud 项目。

  • region (str) – 作业所属的 Google Cloud 区域的 ID。

  • gcp_conn_id (str) – 可选,用于连接到 Google Cloud Platform 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的链式帐户列表,该帐户将在请求中被模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须将“服务帐户令牌创建者”IAM 角色授予紧邻的前一个身份,列表中的第一个帐户将此角色授予原始帐户(模板化)。

  • polling_interval_seconds (int) – 轮询状态的间隔(以秒为单位)。

serialize()[源代码]

返回重建此触发器所需的信息。

返回

(类路径,重新实例化所需的关键字参数)的元组。

async run()[源代码]

在异步上下文中运行触发器。

触发器应在其想要触发事件时产生一个 Event,并在完成后返回 None。因此,单事件触发器应该产生,然后立即返回。

如果它产生,则很可能它会很快恢复,但可能不会(例如,如果工作负载正在被移动到另一个触发器进程,或者多事件触发器被用于单事件任务延迟)。

在任何一种情况下,Trigger 类都应该假设它们将被持久化,然后依赖于在不再需要它们时调用 cleanup()。

class airflow.providers.google.cloud.triggers.dataplex.DataplexDataProfileJobTrigger(job_id, data_scan_id, project_id, region, gcp_conn_id='google_cloud_default', polling_interval_seconds=10, impersonation_chain=None, **kwargs)[源代码]

基类: airflow.triggers.base.BaseTrigger

DataplexDataProfileJobTrigger 在触发器工作器上运行,并等待作业达到 SUCCEEDED 状态。

参数
  • job_id (str | None) – 可选。Dataplex 作业的 ID。

  • data_scan_id (str) – 必填。DataScan 标识符。

  • project_id (str | None) – 运行作业的 Google Cloud 项目。

  • region (str) – 作业所属的 Google Cloud 区域的 ID。

  • gcp_conn_id (str) – 可选,用于连接到 Google Cloud Platform 的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据模拟身份,或获取列表中最后一个帐户的 access_token 所需的链式帐户列表,该帐户将在请求中被模拟身份。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的身份必须将“服务帐户令牌创建者”IAM 角色授予紧邻的前一个身份,列表中的第一个帐户将此角色授予原始帐户(模板化)。

  • polling_interval_seconds (int) – 轮询状态的间隔(以秒为单位)。

serialize()[源代码]

返回重建此触发器所需的信息。

返回

(类路径,重新实例化所需的关键字参数)的元组。

async run()[源代码]

在异步上下文中运行触发器。

触发器应在其想要触发事件时产生一个 Event,并在完成后返回 None。因此,单事件触发器应该产生,然后立即返回。

如果它产生,则很可能它会很快恢复,但可能不会(例如,如果工作负载正在被移动到另一个触发器进程,或者多事件触发器被用于单事件任务延迟)。

在任何一种情况下,Trigger 类都应该假设它们将被持久化,然后依赖于在不再需要它们时调用 cleanup()。

此条目是否有帮助?