Spark 0.6.1 版本发布

Spark 0.6.1 是一个维护版本,包含一些重要的 bug 修复和性能改进。您可以下载它的 源代码包 (2.4 MB tar.gz) 或 预构建包 (48 MB tar.gz)。

此版本中的修复和改进包括

  • 修复了可能导致 worker 与集群断开连接的过于激进的消息超时
  • 修复了独立部署模式中未将主机名暴露给调度程序的 bug,影响了 HDFS 的 locality
  • 改进了 shuffle 中的连接重用,可以大大加快小型 shuffle 的速度 (由 Reynold Xin 贡献)
  • 修复了 block manager 中一些潜在的死锁 (由 Tathagata Das 贡献)
  • 修复了从 Mesos 获取失败主机 ID 的 bug (由 Imran Rashid 贡献)
  • 改进了一些 EC2 脚本,例如更好地处理 spot 实例 (由 Josh Rosen 贡献)
  • 使 Spark 绑定的本地 IP 地址可自定义 (由 Mikhail Bautin 贡献)
  • 支持 Hadoop 2 发行版 (由 Thomas Dudziak 贡献)
  • 支持在 Debian 发行版上查找 Scala (由 Thomas Dudziak 贡献)
  • 改进了独立集群 Web UI,以显示有关作业的更多信息
  • 添加了一个选项,可以将作业分散到独立集群中,而不是将它们集中在少数节点上 (spark.deploy.spreadOut)

我们建议所有 Spark 0.6 用户更新到此维护版本。


Spark 新闻存档

最新消息

存档