Google 表格到 Google Cloud Storage 传输算子¶
Google 有一项服务 Google Cloud Storage。此服务用于存储来自各种应用程序的大数据。
使用 Google 表格,每个人都可以同时在同一张电子表格中协作。使用公式函数和格式化选项来节省时间并简化常见的电子表格任务。
先决任务¶
要使用这些算子,您必须执行以下操作
使用 Cloud 控制台 选择或创建一个 Cloud Platform 项目。
为您的项目启用帐单,如 Google Cloud 文档 中所述。
启用 API,如 Cloud 控制台文档 中所述。
通过 pip 安装 API 库。
pip install 'apache-airflow[google]'有关 安装 的详细信息,请参阅。
将数据从 Google 表格上传到 GCS¶
要将数据从 Google 电子表格上传到 Google Cloud Storage,可以使用 GoogleSheetsToGCSOperator
。
upload_sheet_to_gcs = GoogleSheetsToGCSOperator(
task_id="upload_sheet_to_gcs",
destination_bucket=BUCKET_NAME,
spreadsheet_id="{{ task_instance.xcom_pull(task_ids='create_spreadsheet', "
"key='spreadsheet_id') }}",
gcp_conn_id=CONNECTION_ID,
)
您可以将 Jinja 模板 与 spreadsheet_id
, destination_bucket
, destination_path
, sheet_filter
, impersonation_chain
搭配使用。