Google Sheets 到 Google Cloud Storage 传输操作符¶
Google 提供一项名为 Google Cloud Storage 的服务。此服务用于存储来自各种应用程序的大量数据。
使用 Google Sheets,每个人都可以同时在同一电子表格中协同工作。使用公式函数和格式化选项来节省时间并简化常见的电子表格任务。
先决条件任务¶
要使用这些操作符,您必须执行以下操作
使用 Cloud Console 选择或创建 Cloud Platform 项目。
按照 Google Cloud 文档中的说明,为您的项目启用结算功能。
按照 Cloud Console 文档中的说明,启用 API。
通过 pip 安装 API 库。
pip install 'apache-airflow[google]'有关详细信息,请参阅 安装。
将数据从 Google Sheets 上传到 GCS¶
要将数据从 Google 电子表格上传到 Google Cloud Storage,您可以使用 GoogleSheetsToGCSOperator
。
upload_sheet_to_gcs = GoogleSheetsToGCSOperator(
task_id="upload_sheet_to_gcs",
destination_bucket=BUCKET_NAME,
spreadsheet_id="{{ task_instance.xcom_pull(task_ids='create_spreadsheet', "
"key='spreadsheet_id') }}",
gcp_conn_id=CONNECTION_ID,
)
您可以使用 Jinja 模板以及 spreadsheet_id
、destination_bucket
、destination_path
、sheet_filter
、impersonation_chain
。