Google Cloud Speech to Text 算子¶
先决任务¶
要使用这些算子,必须执行以下操作
使用Cloud 控制台选择或创建 Cloud Platform 项目。
为你的项目启用帐单,如Google Cloud 文档中所述。
启用 API,如Cloud 控制台文档中所述。
通过pip安装 API 库。
pip install 'apache-airflow[google]'有关详细信息,请参阅安装。
CloudSpeechToTextRecognizeSpeechOperator¶
识别音频输入中的语音并返回文本。
有关参数定义,请参阅CloudSpeechToTextRecognizeSpeechOperator
参数¶
config 和 audio 参数需要是字典或 google.cloud.speech_v1.types 模块中相应类的对象
INPUT = {"text": "Sample text for demo purposes"}
VOICE = {"language_code": "en-US", "ssml_gender": "FEMALE"}
AUDIO_CONFIG = {"audio_encoding": "LINEAR16"}
filename 是一个简单的字符串参数
CONFIG = RecognitionConfig({"encoding": "LINEAR16", "language_code": "en_US"})
AUDIO = RecognitionAudio({"uri": f"gs://{BUCKET_NAME}/{FILE_NAME}"})
使用运算符¶
speech_to_text_recognize_task = CloudSpeechToTextRecognizeSpeechOperator(
config=CONFIG, audio=AUDIO, task_id="speech_to_text_recognize_task"
)
模板化¶
template_fields: Sequence[str] = (
"audio",
"config",
"project_id",
"gcp_conn_id",
"timeout",
"impersonation_chain",
)