Google Cloud Speech to Text Operator¶

前置任务¶

要使用这些 Operator，您必须完成一些事情

使用 Cloud Console 选择或创建 Cloud Platform 项目。

为您的项目启用计费，如 Google Cloud 文档中所述。

启用 API，如 Cloud Console 文档中所述。
通过 pip 安装 API 库。
pip install 'apache-airflow[google]'
安装的详细信息可在安装中找到。
设置 Google Cloud 连接.

CloudSpeechToTextRecognizeSpeechOperator¶

识别音频输入中的语音并返回文本。

有关参数定义，请参阅 CloudSpeechToTextRecognizeSpeechOperator

参数¶

config 和 audio 参数需要是 dicts 或来自 google.cloud.speech_v1.types 模块的相应类对象

tests/system/google/cloud/speech_to_text/example_speech_to_text.py

INPUT = {"text": "Sample text for demo purposes"}
VOICE = {"language_code": "en-US", "ssml_gender": "FEMALE"}
AUDIO_CONFIG = {"audio_encoding": "LINEAR16"}

filename 是一个简单的字符串参数

tests/system/google/cloud/speech_to_text/example_speech_to_text.py

CONFIG = RecognitionConfig({"encoding": "LINEAR16", "language_code": "en_US"})
AUDIO = RecognitionAudio({"uri": f"gs://{BUCKET_NAME}/{FILE_NAME}"})

使用 Operator¶

tests/system/google/cloud/speech_to_text/example_speech_to_text.py

speech_to_text_recognize_task = CloudSpeechToTextRecognizeSpeechOperator(
    config=CONFIG, audio=AUDIO, task_id="speech_to_text_recognize_task"
)

模板化¶

template_fields: Sequence[str] = (
    "audio",
    "config",
    "project_id",
    "gcp_conn_id",
    "timeout",
    "impersonation_chain",
)

参考¶

更多信息，请参阅