Google Cloud 翻译操作符

先决任务

要使用这些操作符,您必须执行以下几项操作

CloudTranslateTextOperator

翻译字符串或字符串列表。

有关参数定义,请查看 CloudTranslateTextOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate.py[源代码]

product_set_create = CloudTranslateTextOperator(
    task_id="translate",
    values=["zażółć gęślą jaźń"],
    target_language="en",
    format_="text",
    source_language=None,
    model="base",
)

翻译结果可作为字典或字典数组访问,可通过 Airflow 的常用 XCom 机制访问

tests/system/google/cloud/translate/example_translate.py[源代码]

translation_access = BashOperator(
    task_id="access", bash_command="echo '{{ task_instance.xcom_pull(\"translate\")[0] }}'"
)

模板化

template_fields: Sequence[str] = (
    "values",
    "target_language",
    "format_",
    "source_language",
    "model",
    "gcp_conn_id",
    "impersonation_chain",
)

TranslateTextOperator

翻译一个或多个文本(或 HTML)项的数组。适用于少量文本数据,对于大量文本数据,请使用 TranslateTextBatchOperator

有关参数定义,请查看 TranslateTextOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_text.py[源代码]

translate_text = TranslateTextOperator(
    task_id="translate_v3_op",
    contents=["Ciao mondo!", "Mi puoi prendere una tazza di caffè, per favore?"],
    source_language_code="it",
    target_language_code="en",
)

TranslateTextBatchOperator

一次运行中将大量文本数据翻译成最多 10 种目标语言。输入配置提供了文件列表和其他选项。

有关参数定义,请查看 TranslateTextBatchOperator

TranslateCreateDatasetOperator

使用 Cloud Translate API(高级 V3)创建本机翻译数据集。

有关参数定义,请查看 TranslateCreateDatasetOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_dataset.py[源代码]

create_dataset_op = TranslateCreateDatasetOperator(
    task_id="translate_v3_ds_create",
    dataset=DATASET,
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateImportDataOperator

使用 Cloud Translate API(高级 V3)将数据导入到现有的本机数据集中。

有关参数定义,请查看 TranslateImportDataOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_dataset.py[源代码]

import_ds_data_op = TranslateImportDataOperator(
    task_id="translate_v3_ds_import_data",
    dataset_id=create_dataset_op.output["dataset_id"],
    input_config={
        "input_files": [{"usage": "UNASSIGNED", "gcs_source": {"input_uri": DATASET_DATA_PATH}}]
    },
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateDatasetsListOperator

使用 Cloud Translate API(高级 V3)获取翻译数据集列表。

有关参数定义,请查看 TranslateDatasetsListOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_dataset.py[源代码]

list_datasets_op = TranslateDatasetsListOperator(
    task_id="translate_v3_list_ds",
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateDeleteDatasetOperator

使用 Cloud Translate API(高级 V3)删除本机翻译数据集。

有关参数定义,请查看 TranslateDeleteDatasetOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_dataset.py[源代码]

delete_ds_op = TranslateDeleteDatasetOperator(
    task_id="translate_v3_ds_delete",
    dataset_id=create_dataset_op.output["dataset_id"],
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateCreateModelOperator

使用 Cloud Translate API(高级 V3)创建本机翻译模型。

有关参数定义,请查看 TranslateCreateModelOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_model.py[源代码]

create_model = TranslateCreateModelOperator(
    task_id="translate_v3_model_create",
    display_name=f"native_model_{ENV_ID}"[:32].replace("-", "_"),
    dataset_id=create_dataset_op.output["dataset_id"],
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateModelsListOperator

使用 Cloud Translate API(高级 V3)获取本机翻译模型列表。

有关参数定义,请查看 TranslateModelsListOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_model.py[源代码]

list_models = TranslateModelsListOperator(
    task_id="translate_v3_list_models",
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateDeleteModelOperator

使用 Cloud Translate API(高级 V3)删除本机翻译模型。

有关参数定义,请查看 TranslateDeleteModelOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_model.py[源代码]

delete_model = TranslateDeleteModelOperator(
    task_id="translate_v3_automl_delete_model",
    model_id=model_id,
    project_id=PROJECT_ID,
    location=REGION,
)

TranslateDocumentOperator

使用 Cloud Translate API(高级 V3)翻译文档。

有关参数定义,请查看 TranslateDocumentOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_document.py[源代码]

translate_document = TranslateDocumentOperator(
    task_id="translate_document_op",
    project_id=PROJECT_ID,
    location=REGION,
    source_language_code="en",
    target_language_code="uk",
    document_input_config=DOC_TRANSLATE_INPUT,
    document_output_config=GCS_OUTPUT_DST,
)

TranslateDocumentBatchOperator

通过给定的输入配置,使用 Cloud Translate API(高级 V3)翻译文档。

有关参数定义,请查看 TranslateDocumentBatchOperator

使用操作符

操作符的基本用法

tests/system/google/cloud/translate/example_translate_document.py[源代码]

translate_document_batch = TranslateDocumentBatchOperator(
    task_id="batch_translate_document_op",
    project_id=PROJECT_ID,
    location=REGION,
    source_language_code="en",
    target_language_codes=["uk", "fr"],
    input_configs=[BATCH_DOC_INPUT_ITEM_1, BATCH_DOC_INPUT_ITEM_2],
    output_config=BATCH_OUTPUT_CONFIG,
)

更多信息

请参阅:基本 (V2) Google Cloud 翻译文档。 高级 (V3) Google Cloud 翻译(高级)文档。 数据集 传统和原生数据集比较

参考

欲了解更多信息,请查看

此条目是否有帮助?