DatabricksReposUpdateOperator

使用 DatabricksReposUpdateOperator 通过 api/2.0/repos/ API 端点将现有 Databricks Repos 中的代码更新到给定的 Git 分支或标签。

使用操作符

此操作符通常用于在执行 Databricks 作业之前更新其源代码。要使用此操作符,你需要提供 branchtag 以及 repo_pathrepo_id

参数

输入

branch: str

要更新到的现有 Git 分支的名称(如果未提供 tag,则必需)。

tag: str

要更新到的现有 Git 标签的名称(如果未提供 branch,则必需)。

repo_path: str

现有 Databricks Repos 的路径,例如 /Repos/<user_email>/repo_name(如果未提供 repo_id,则必需)。

repo_id: str

现有 Databricks Repos 的 ID(如果未提供 repo_path,则必需)。

databricks_conn_id: string

要使用的 Airflow 连接的名称。

databricks_retry_limit: integer

如果 Databricks 后端不可访问,则重试的次数。

databricks_retry_delay: decimal

重试之间等待的秒数。

示例

通过指定路径更新 Databricks Repo

DatabricksReposUpdateOperator 的示例用法如下

tests/system/providers/databricks/example_databricks_repos.py[源代码]

    # Example of updating a Databricks Repo to the latest code
    repo_path = "/Repos/[email protected]/demo-repo"
    update_repo = DatabricksReposUpdateOperator(task_id="update_repo", repo_path=repo_path, branch="releases")

此条目有帮助吗?