4.0.0

概述
编程指南
快速开始 RDDs、累加器、广播变量 SQL、DataFrames 和 Datasets 结构化流 Spark Streaming (DStreams) MLlib (机器学习) GraphX (图处理) SparkR (Spark 上的 R) PySpark (Spark 上的 Python)
API 文档
Python Scala Java R SQL、内置函数
部署
概述提交应用程序
Spark Standalone YARN Kubernetes
更多
配置监控调优指南作业调度安全硬件配置迁移指南
构建 Spark 贡献 Spark 第三方项目

结构化流编程指南

从 Spark 4.0.0 开始，《结构化流编程指南》已被拆分成更小、更易读的页面。您可以在此处找到这些页面。