Azure DataLake Storage 操作符¶
先决条件任务¶
要使用这些操作符,您必须执行以下几项操作
使用 AZURE PORTAL 或 AZURE CLI 创建必要的资源。
通过 pip 安装 API 库。
pip install 'apache-airflow[azure]'详细信息请参考 Airflow® 的安装
设置连接.
ADLSCreateObjectOperator¶
ADLSCreateObjectOperator
允许您将数据上传到 Azure DataLake Storage
以下是使用此操作符将数据上传到 ADL 的示例。
upload_data = ADLSCreateObjectOperator(
task_id="upload_data",
file_system_name="Fabric",
file_name=REMOTE_FILE_PATH,
data="Hello world",
replace=True,
)
ADLSDeleteOperator¶
使用 ADLSDeleteOperator
从 Azure DataLake Storage 中删除文件
以下是使用此操作符从 ADL 中删除文件的示例。
remove_file = ADLSDeleteOperator(task_id="delete_task", path=REMOTE_FILE_PATH, recursive=True)
ADLSListOperator¶
使用 ADLSListOperator
列出 Azure DataLake Storage 中的所有文件
以下是使用此操作符列出 ADL 中文件的示例。
adls_files = ADLSListOperator(
task_id="adls_files",
path="folder/output/*.parquet",
azure_data_lake_conn_id="azure_data_lake_default",
)