airflow.providers.google.cloud.operators.dlp
¶
各种 Google Cloud DLP 操作符,允许您使用 Cloud DLP 执行基本操作。
模块内容¶
类¶
在长时间运行的 DlpJob 上启动异步取消。 |
|
创建去标识模板以重用内容、图像和存储的常用配置。 |
|
创建新作业以检查存储或计算风险指标。 |
|
创建 InspectTemplate 以重用内容、图像和存储的常用配置。 |
|
创建作业触发器以运行 DLP 操作,例如按照设定的时间表扫描存储中是否存在敏感信息。 |
|
创建预构建的存储信息类型以用于检查。 |
|
对内容项中可能存在的敏感信息进行去标识;限制输入大小和输出大小。 |
|
删除 DeidentifyTemplate。 |
|
删除长时间运行的 DlpJob。 |
|
删除 InspectTemplate。 |
|
删除作业触发器。 |
|
删除存储的信息类型。 |
|
获取 DeidentifyTemplate。 |
|
获取长时间运行的 DlpJob 的最新状态。 |
|
获取 InspectTemplate。 |
|
获取作业触发器。 |
|
获取存储的信息类型。 |
|
查找内容中可能存在的敏感信息;限制输入大小、处理时间和输出大小。 |
|
列出 DeidentifyTemplate。 |
|
列出与请求中指定筛选器匹配的 DlpJob。 |
|
返回 DLP API 支持的敏感信息类型列表。 |
|
列出 InspectTemplate。 |
|
列出作业触发器。 |
|
列出存储的信息类型。 |
|
从图像中编辑可能存在的敏感信息;限制输入大小、处理时间和输出大小。 |
|
重新标识已去标识的内容。 |
|
更新 DeidentifyTemplate。 |
|
更新 InspectTemplate。 |
|
更新作业触发器。 |
|
通过创建新版本来更新存储的信息类型。 |
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCancelDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
在长时间运行的 DlpJob 上启动异步取消。
另请参阅
有关如何使用此操作符的更多信息,请查看指南: 取消作业
- 参数
dlp_job_id (str) – 要取消的 DLP 作业资源的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDeidentifyTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建去标识模板以重用内容、图像和存储的常用配置。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:去标识模板
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – (可选)要创建的 DeidentifyTemplate。
template_id (str | None) – (可选)模板 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'deidentify_template', 'template_id', 'gcp_conn_id',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDLPJobOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_job=None, risk_job=None, job_id=None, retry=DEFAULT, timeout=None, metadata=(), wait_until_finished=True, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建新作业以检查存储或计算风险指标。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:创建作业
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
inspect_job (dict | google.cloud.dlp_v2.types.InspectJobConfig | None) – (可选)检查作业的配置。
risk_job (dict | google.cloud.dlp_v2.types.RiskAnalysisJobConfig | None) – (可选)风险作业的配置。
job_id (str | None) – (可选)作业 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
wait_until_finished (bool) – (可选)如果为 true,它将持续轮询作业状态,直到设置为 DONE。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_job', 'risk_job', 'job_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateInspectTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建 InspectTemplate 以重用内容、图像和存储的常用配置。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:创建模板
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
inspect_template (google.cloud.dlp_v2.types.InspectTemplate | None) – (可选)要创建的 InspectTemplate。
template_id (str | None) – (可选)模板 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'inspect_template', 'template_id', 'gcp_conn_id',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateJobTriggerOperator(*, project_id=PROVIDE_PROJECT_ID, job_trigger=None, trigger_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建作业触发器以运行 DLP 操作,例如按照设定的时间表扫描存储中是否存在敏感信息。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:创建作业触发器
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – (可选) 要创建的 JobTrigger。
trigger_id (str | None) – (可选) JobTrigger ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'job_trigger', 'trigger_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateStoredInfoTypeOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, stored_info_type_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
创建预构建的存储信息类型以用于检查。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:创建存储的 Info-Type
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
config (google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – (可选)StoredInfoType 的配置。
stored_info_type_id (str | None) – (可选)StoredInfoType ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'config', 'stored_info_type_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, deidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, deidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
对内容项中可能存在的敏感信息进行去标识;限制输入大小和输出大小。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:去标识内容
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
deidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可选) 用于去标识内容项的配置。 此处指定的项将覆盖由 deidentify_template_name 参数引用的模板。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选) 用于检查器的配置。此处指定的项将覆盖由 inspect_template_name 参数引用的模板。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选) 要去标识的项目。 将被视为文本。
inspect_template_name (str | None) – (可选) 要使用的可选模板。 在 inspect_config 中直接指定的任何配置将覆盖在模板中设置的配置。
deidentify_template_name (str | None) – (可选) 要使用的可选模板。 在 deidentify_config 中直接指定的任何配置将覆盖在模板中设置的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'deidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除 DeidentifyTemplate。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:去标识模板
- 参数
template_id (str) – 要删除的去标识模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除长时间运行的 DlpJob。
此方法表示客户端不再对 DlpJob 结果感兴趣。如果可能,将取消该作业。
另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:删除作业
- 参数
dlp_job_id (str) – 要删除的 DLP 作业资源的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除 InspectTemplate。
另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:删除模板
- 参数
template_id (str) – 要删除的检查模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除作业触发器。
另请参阅
有关如何使用此运算符的更多信息,请查看以下指南:内容方法
- 参数
job_trigger_id (str) – 要删除的 DLP 作业触发器的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
删除存储的信息类型。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:删除存储的信息类型
- 参数
stored_info_type_id (str) – 要删除的存储信息类型的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取 DeidentifyTemplate。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:去标识模板
- 参数
template_id (str) – 要读取的去标识模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取长时间运行的 DlpJob 的最新状态。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:检索作业
- 参数
dlp_job_id (str) – 要读取的 DLP 作业资源的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[源代码]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取 InspectTemplate。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:检索模板
- 参数
template_id (str) – 要读取的检查模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取作业触发器。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:检索作业触发器
- 参数
job_trigger_id (str) – 要读取的 DLP 作业触发器的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
获取存储的信息类型。
另请参阅
有关如何使用此运算符的更多信息,请参阅指南:检索存储的 InfoType
- 参数
stored_info_type_id (str) – 要读取的已存储信息类型的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPInspectContentOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, item=None, inspect_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
查找内容中可能存在的敏感信息;限制输入大小、处理时间和输出大小。
另请参阅
有关如何使用此操作符的更多信息,请参阅指南:使用模板
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选) 用于检查器的配置。此处指定的项将覆盖由 inspect_template_name 参数引用的模板。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选) 要去标识的项目。 将被视为文本。
inspect_template_name (str | None) – (可选) 要使用的可选模板。 在 inspect_config 中直接指定的任何配置将覆盖在模板中设置的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'item', 'inspect_template_name', 'gcp_conn_id', 'impersonation_chain')[源]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListDeidentifyTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出 DeidentifyTemplate。
另请参阅
有关如何使用此操作符的更多信息,请参阅指南:去标识模板
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数。
order_by (str | None) – (可选) 可选的以逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[源]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListDLPJobsOperator(*, project_id=PROVIDE_PROJECT_ID, results_filter=None, page_size=None, job_type=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出与请求中指定筛选器匹配的 DlpJob。
另请参阅
有关如何使用此操作符的更多信息,请参阅指南:检索作业
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
results_filter (str | None) – (可选) 用于指定结果子集的过滤器。
page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数。
job_type (str | None) – (可选) 作业类型。
order_by (str | None) – (可选) 可选的以逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[源]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListInfoTypesOperator(*, project_id=PROVIDE_PROJECT_ID, language_code=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
返回 DLP API 支持的敏感信息类型列表。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南: 检索存储的信息类型
- 参数
language_code (str | None) – (可选) 用于本地化 infoType 友好名称的可选 BCP-47 语言代码。如果省略,或者如果本地化字符串不可用,将返回 en-US 字符串。
results_filter (str | None) – (可选) 用于指定结果子集的过滤器。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('language_code', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListInspectTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出 InspectTemplate。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南: 检索模板
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数。
order_by (str | None) – (可选) 可选的以逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListJobTriggersOperator(*, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出作业触发器。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南: 检索作业触发器
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数。
order_by (str | None) – (可选) 可选的以逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。
results_filter (str | None) – (可选) 用于指定结果子集的过滤器。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListStoredInfoTypesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
列出存储的信息类型。
另请参阅
关于如何使用此操作符的更多信息,请查看指南:检索存储的信息类型
- 参数
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
page_size (int | None) – (可选) 底层 API 响应中包含的最大资源数。
order_by (str | None) – (可选) 可选的以逗号分隔的字段列表,用于排序,后跟 asc 或 desc 后缀。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPRedactImageOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, image_redaction_configs=None, include_findings=None, byte_item=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
从图像中编辑可能存在的敏感信息;限制输入大小、处理时间和输出大小。
另请参阅
关于如何使用此操作符的更多信息,请查看指南:参考
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选) 用于检查器的配置。此处指定的项将覆盖由 inspect_template_name 参数引用的模板。
image_redaction_configs (None | list[dict] | list[google.cloud.dlp_v2.types.RedactImageRequest.ImageRedactionConfig]) – (可选) 用于指定要从图像中编辑的内容的配置。
include_findings (bool | None) – (可选) 响应是否应包含调查结果以及编辑后的图像。
byte_item (dict | google.cloud.dlp_v2.types.ByteContentItem | None) – (可选) 内容必须是 PNG、JPEG、SVG 或 BMP。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'image_redaction_configs', 'include_findings', 'byte_item',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPReidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, reidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, reidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
重新标识已去标识的内容。
另请参阅
关于如何使用此操作符的更多信息,请查看指南:重新标识内容
- 参数
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
reidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可选) 用于重新标识内容项的配置。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可选) 用于检查器的配置。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可选) 要重新标识的项目。将被视为文本。
inspect_template_name (str | None) – (可选) 要使用的可选模板。 在 inspect_config 中直接指定的任何配置将覆盖在模板中设置的配置。
reidentify_template_name (str | None) – (可选) 要使用的可选模板。引用 DeidentifyTemplate 的实例。直接在 reidentify_config 或 inspect_config 中指定的任何配置将覆盖模板中设置的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'reidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新 DeidentifyTemplate。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:去标识模板
- 参数
template_id (str) – 要更新的去标识模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – 新的 DeidentifyTemplate 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制更新哪些字段的掩码。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'deidentify_template', 'update_mask',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新 InspectTemplate。
另请参阅
有关如何使用此操作符的更多信息,请查看指南:更新模板
- 参数
template_id (str) – 要更新的检查模板的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
inspect_template (dict | google.cloud.dlp_v2.types.InspectTemplate | None) – 新的 InspectTemplate 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制更新哪些字段的掩码。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'inspect_template', 'update_mask',...[source]¶
- 类 airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, job_trigger=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
更新作业触发器。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南:更新作业触发器
- 参数
job_trigger_id – 要更新的 DLP 作业触发器的 ID。
project_id (str) – (可选) DLP 实例所在的 Google Cloud 项目 ID。如果设置为 None 或缺失,则使用 Google Cloud 连接中的默认 project_id。
job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – 新的 JobTrigger 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制更新哪些字段的掩码。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'job_trigger', 'update_mask', 'gcp_conn_id', 'impersonation_chain')[源]¶
- 类 airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源]¶
基类:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator
通过创建新版本来更新存储的信息类型。
另请参阅
有关如何使用此操作符的更多信息,请查看以下指南:更新存储的信息类型
- 参数
stored_info_type_id – 要更新的存储信息类型的 ID。
organization_id (str | None) – (可选)组织 ID。如果父资源是组织,则需要设置此字段。
project_id (str) – (可选)DLP 实例所在的 Google Cloud 项目 ID。仅当父资源是项目而不是组织时才设置此字段。
config (dict | google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – 存储信息类型的更新配置。如果未提供,将使用现有配置创建存储信息类型的新版本。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用于控制更新哪些字段的掩码。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可选) 用于重试请求的重试对象。如果指定为 None,则不会重试请求。
timeout (float | None) – (可选) 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时应用于每个单独的尝试。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可选) 提供给方法的其他元数据。
gcp_conn_id (str) – (可选) 用于连接到 Google Cloud 的连接 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选服务帐户,用于使用短期凭据模拟身份,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中模拟身份。如果设置为字符串,则该帐户必须授予原始帐户服务帐户令牌创建者 IAM 角色。如果设置为序列,则列表中的身份必须将服务帐户令牌创建者 IAM 角色授予直接前面的身份,列表中的第一个帐户将此角色授予原始帐户(已模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'config', 'update_mask', 'gcp_conn_id',...[源]¶