Apache Spark 文档

下面列出了每个 Spark 稳定版本的设置说明、编程指南和其他文档

预览版文档

以上链接的文档涵盖了Spark入门,以及内置组件MLlibSpark StreamingGraphX

此外,本页面还列出了其他学习Spark的资源。

视频

请查看Apache Spark YouTube频道,观看Spark活动的视频。有针对不同主题的独立播放列表。除了浏览播放列表,您还可以在下方找到视频的直接链接。

录屏教程视频

Spark Summit 视频

线下交流会视频

除了以下列出的视频,您还可以在这里查看湾区线下交流会的所有幻灯片

培训资料

  • Spark Summit 2014 的培训资料和练习已在线提供。这些包括讲座视频和幻灯片,以及您可以在笔记本电脑上运行的练习。主题包括Spark核心、调优和调试、Spark SQL、Spark Streaming、GraphX和MLlib。
  • Spark Summit 2013包括一个培训课程,幻灯片和视频可在培训日议程中获取。该课程还包括您可以在Amazon EC2上操作的练习
  • 加州大学伯克利分校AMPLab定期举办Spark及相关项目的训练营。每个训练营的幻灯片、视频和基于EC2的练习均可在线获取
    • AMP Camp 4 (Strata Santa Clara, 2014年2月) — 重点关注 BlinkDB, MLlib, GraphX, Tachyon
    • AMP Camp 3 (加州伯克利, 2013年8月)
    • AMP Camp 2 (Strata Santa Clara, 2013年2月)
    • AMP Camp 1 (加州伯克利, 2012年8月)

实践练习

  • Spark Summit 2014 的实践练习。这些练习让您可以在笔记本电脑上安装 Spark,并学习基本概念、Spark SQL、Spark Streaming、GraphX 和 MLlib。
  • Spark Summit 2013 的动手练习。这些练习让您可以启动一个小型 EC2 集群,加载数据集,并使用 Spark、Shark、Spark Streaming 和 MLlib 进行查询。

外部教程、博客文章和演讲

书籍

示例

研究论文

Spark 最初是作为加州大学伯克利分校的一个研究项目开发的,大部分设计都记录在论文中。研究页面列出了一些最初的动机和方向。