Apache Spark 文档

以下提供了每个 Spark 稳定版本的设置说明、编程指南和其他文档

预览版本的文档

上面链接的文档涵盖了 Spark 入门,以及内置组件 MLlibSpark StreamingGraphX

此外,此页面列出了学习 Spark 的其他资源。

视频

请参阅 Apache Spark YouTube 频道,了解 Spark 活动中的视频。 针对不同主题的视频,有单独的播放列表。 除了浏览播放列表外,您还可以在下面找到指向视频的直接链接。

截屏教程视频

Spark Summit 视频

Meetup 演讲视频

除了下面列出的视频外,您还可以在此处查看湾区 meetups 的所有幻灯片

培训材料

  • Spark Summit 2014 的培训材料和练习可在线获取。 其中包括会谈的视频和幻灯片,以及您可以在笔记本电脑上运行的练习。 主题包括 Spark 核心、调整和调试、Spark SQL、Spark Streaming、GraphX 和 MLlib。
  • Spark Summit 2013 包括一个培训课程,幻灯片和视频可在 培训日议程上找到。 该课程还包括您可以在 Amazon EC2 上完成的练习
  • 加州大学伯克利分校 AMPLab 定期举办关于 Spark 和相关项目的训练营。 每个训练营的幻灯片、视频和基于 EC2 的练习都可在线获取
    • AMP Camp 4 (Strata Santa Clara, Feb 2014) — 重点关注 BlinkDB、MLlib、GraphX、Tachyon
    • AMP Camp 3 (Berkeley, CA, Aug 2013)
    • AMP Camp 2 (Strata Santa Clara, Feb 2013)
    • AMP Camp 1 (Berkeley, CA, Aug 2012)

动手练习

  • Spark Summit 2014 的动手练习。 这些练习让您可以在笔记本电脑上安装 Spark 并学习基本概念、Spark SQL、Spark Streaming、GraphX 和 MLlib。
  • Spark Summit 2013 的动手练习。 这些练习让您可以启动一个小型 EC2 集群,加载数据集,并使用 Spark、Shark、Spark Streaming 和 MLlib 查询它。

外部教程、博客文章和演讲

书籍

示例

研究论文

Spark 最初是作为加州大学伯克利分校的研究项目开发的,其大部分设计都记录在论文中。 研究页面列出了一些最初的动机和方向。

最新消息

归档