airflow.providers.google.cloud.hooks.natural_language

此模块包含一个 Google Cloud Natural Language Hook。

模块内容

CloudNaturalLanguageHook

用于 Google Cloud Natural Language 服务的 Hook。

class airflow.providers.google.cloud.hooks.natural_language.CloudNaturalLanguageHook(gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[源代码]

基类:airflow.providers.google.common.hooks.base_google.GoogleBaseHook

用于 Google Cloud Natural Language 服务的 Hook。

参数
  • gcp_conn_id (str) – 获取连接信息时使用的连接 ID。

  • impersonation_chain (str | collections.abc.Sequence[str] | None) – 可选的服务帐户,用于使用短期凭据进行模拟,或用于获取列表中最后一个帐户的 access_token 的链式帐户列表,该帐户将在请求中被模拟。如果设置为字符串,则该帐户必须授予原始帐户“服务帐户令牌创建者”IAM 角色。如果设置为序列,则列表中的标识必须将“服务帐户令牌创建者”IAM 角色授予直接前面的标识,列表中第一个帐户将此角色授予原始帐户。

get_conn()[源代码]

检索到 Cloud Natural Language 服务的连接。

返回

Cloud Natural Language 服务对象

返回类型

google.cloud.language_v1.LanguageServiceClient

analyze_entities(document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=())[源代码]

在文本中查找命名实体以及各种属性。

示例属性:实体类型、显著性、每个实体的提及等等。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.EncodingType | None) – API 用来计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

analyze_entity_sentiment(document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=())[源代码]

与 AnalyzeEntities 类似,还会分析与每个实体及其提及相关的情感。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.EncodingType | None) – API 用来计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

analyze_sentiment(document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=())[源代码]

分析提供的文本的情感。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.EncodingType | None) – API 用来计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

analyze_syntax(document, encoding_type=None, retry=DEFAULT, timeout=None, metadata=())[源代码]

分析文本的语法。

提供句子边界和分词,以及词性标签、依存关系树和其他属性。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • encoding_type (google.cloud.language_v1.EncodingType | None) – API 用来计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

annotate_text(文档, 特性, 编码类型=None, 重试=DEFAULT, 超时=None, 元数据=())[源代码]

在一个调用中提供 analyzeSentiment、analyzeEntities 和 analyzeSyntax 提供的所有特性。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • 特性 (dict | google.cloud.language_v1.types.AnnotateTextRequest.Features) – 已启用的特性。如果提供了字典,则它必须与 protobuf 消息 Features 的形式相同

  • encoding_type (google.cloud.language_v1.EncodingType | None) – API 用来计算偏移量的编码类型。

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

classify_text(文档, 重试=DEFAULT, 超时=None, 元数据=())[源代码]

将文档分类到各个类别中。

参数
  • document (dict | google.cloud.language_v1.types.Document) – 输入文档。如果提供了 dict,则它必须与 protobuf 消息 Document 的形式相同

  • retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用于重试请求的重试对象。如果指定为 None,则不会重试请求。

  • timeout (float | None) – 等待请求完成的时间量(以秒为单位)。请注意,如果指定了重试,则超时适用于每个单独的尝试。

  • metadata (collections.abc.Sequence[tuple[str, str]]) – 提供给该方法的其他元数据。

此条目是否有帮助?