我们很高兴地宣布 Spark 1.2.0 的发布!Spark 1.2.0 是 1.X API 兼容系列的第三个版本。这是 Spark 迄今为止最大的版本发布,汇集了 172 位开发者的贡献和超过 1,000 次提交!
此版本为 Spark 核心带来了操作和性能改进,包括为超大规模数据混洗设计的新网络传输子系统。Spark SQL 引入了外部数据源 API,并支持 Hive 13、动态分区以及定精度小数类型。MLlib 新增了一个面向管道的包 (spark.ml),用于组合多种算法。Spark Streaming 添加了 Python API 和用于容错的预写日志。最后,GraphX 已从 Alpha 阶段毕业,并引入了稳定的 API。