DatabricksReposUpdateOperator

使用 DatabricksReposUpdateOperator 通过 api/2.0/repos/ API 端点,将现有 Databricks Repos 中的代码更新到给定的 Git 分支或标签。

使用操作符

通常,此操作符用于在 Databricks 作业执行之前更新其源代码。要使用此操作符,您需要提供 branchtag,以及 repo_pathrepo_id 中的一个。

参数

输入

branch: str

要更新到的现有 Git 分支的名称(如果未提供 tag,则为必需)。

tag: str

要更新到的现有 Git 标签的名称(如果未提供 branch,则为必需)。

repo_path: str

现有 Databricks Repos 的路径,例如, /Repos/<user_email>/repo_name(如果未提供 repo_id,则为必需)。

repo_id: str

现有 Databricks Repos 的 ID(如果未提供 repo_path,则为必需)。

databricks_conn_id: string

要使用的 Airflow 连接的名称。

databricks_retry_limit: integer

如果 Databricks 后端不可达,则重试的次数。

databricks_retry_delay: decimal

重试之间的等待秒数。

示例

通过指定路径更新 Databricks Repo

以下是 DatabricksReposUpdateOperator 的使用示例

tests/system/databricks/example_databricks_repos.py[源代码]

    # Example of updating a Databricks Repo to the latest code
    repo_path = "/Repos/[email protected]/demo-repo"
    update_repo = DatabricksReposUpdateOperator(task_id="update_repo", repo_path=repo_path, branch="releases")

此条目是否有帮助?