Yandex.Cloud Data Proc 操作符

Yandex Data Proc 是一项服务,可帮助您在 Yandex Cloud 基础设施中部署 Apache Hadoop®* 和 Apache Spark™ 集群。

使用 Data Proc,您可以管理集群大小和节点容量,以及使用各种 Apache® 服务,例如 Spark、HDFS、YARN、Hive、HBase、Oozie、Sqoop、Flume、Tez 和 Zeppelin。

Apache Hadoop 用于存储和分析结构化和非结构化大数据。

Apache Spark 是一种用于快速数据处理的工具,可以与 Apache Hadoop 和其他存储系统集成。

使用操作符

要了解如何使用 Data Proc 操作符,请参阅示例 DAG

此条目是否有帮助?