Spark 1.2.0 发布

我们很高兴宣布 Spark 1.2.0 的发布! Spark 1.2.0 是 API 兼容的 1.X 系列的第三个版本。 它是 Spark 迄今为止最大的版本,来自 172 位开发者的贡献超过 1,000 次提交!

此版本带来了 Spark 核心的运行和性能改进,包括专为非常大的 Shuffle 设计的新的网络传输子系统。 Spark SQL 引入了外部数据源的 API 以及 Hive 13 支持、动态分区和固定精度十进制类型。 MLlib 添加了一个新的面向管道的软件包 (spark.ml) 用于组合多种算法。 Spark Streaming 添加了一个 Python API 和一个用于容错的预写日志。 最后,GraphX 已经从 alpha 毕业并引入了一个稳定的 API。

访问发行说明以了解新功能,或立即下载该版本。


Spark 新闻存档