Spark 1.2.0 发布

我们很高兴地宣布 Spark 1.2.0 的发布!Spark 1.2.0 是 1.X API 兼容系列的第三个版本。这是 Spark 迄今为止最大的版本发布,汇集了 172 位开发者的贡献和超过 1,000 次提交!

此版本为 Spark 核心带来了操作和性能改进,包括为超大规模数据混洗设计的新网络传输子系统。Spark SQL 引入了外部数据源 API,并支持 Hive 13、动态分区以及定精度小数类型。MLlib 新增了一个面向管道的包 (spark.ml),用于组合多种算法。Spark Streaming 添加了 Python API 和用于容错的预写日志。最后,GraphX 已从 Alpha 阶段毕业,并引入了稳定的 API。

访问发行说明阅读新特性,或者立即下载该版本。


Spark 新闻存档

最新新闻

存档