Apache Spark 文档

每个稳定版本的 Spark 的设置说明、编程指南和其他文档如下所示

预览版本的文档

上面链接的文档涵盖了 Spark 入门,以及内置组件 MLlibSpark StreamingGraphX

此外,此页面还列出了其他学习 Spark 的资源。

视频

请查看 Apache Spark YouTube 频道,观看 Spark 活动的视频。有单独的 播放列表 用于不同主题的视频。除了浏览播放列表外,您还可以找到下面视频的直接链接。

屏幕录制教程视频

Spark 峰会视频

聚会演讲视频

除了下面列出的视频外,您还可以查看 湾区聚会的所有幻灯片

培训材料

  • Spark 峰会 2014 的培训材料和练习 可在线获取。这些包括演讲的视频和幻灯片,以及您可以在笔记本电脑上运行的练习。主题包括 Spark 核心、调整和调试、Spark SQL、Spark Streaming、GraphX 和 MLlib。
  • Spark 峰会 2013 包括一个培训环节,幻灯片和视频可在 培训日议程 上获取。该环节还包括 练习,您可以在 Amazon EC2 上进行操作。
  • 加州大学伯克利分校 AMPLab 定期举办关于 Spark 和相关项目的培训营。每个培训营的幻灯片、视频和基于 EC2 的练习都可在网上获取
    • AMP Camp 4 (Strata 圣克拉拉,2014 年 2 月) - 重点关注 BlinkDB、MLlib、GraphX、Tachyon
    • AMP Camp 3 (伯克利,加州,2013 年 8 月)
    • AMP Camp 2 (Strata 圣克拉拉,2013 年 2 月)
    • AMP Camp 1 (伯克利,加州,2012 年 8 月)

动手练习

  • Spark 峰会 2014 的动手练习。这些练习让您可以在笔记本电脑上安装 Spark 并学习基本概念、Spark SQL、Spark Streaming、GraphX 和 MLlib。
  • Spark 峰会 2013 的动手练习。这些练习让您启动一个小型的 EC2 集群,加载数据集,并使用 Spark、Shark、Spark Streaming 和 MLlib 对其进行查询。

外部教程、博客文章和演讲

书籍

示例

研究论文

Spark 最初是作为加州大学伯克利分校的一个研究项目开发的,其设计的大部分内容都在论文中有所记录。 研究页面 列出了最初的动机和方向。

最新消息

存档