入门# 本页总结了设置和开始使用 PySpark 所需的基本步骤。还有更多与其他语言共享的指南,例如 快速入门 在 Spark 文档的编程指南中。 您可以直接在实时笔记本中尝试 PySpark,无需其他步骤 实时笔记本: DataFrame 实时笔记本: Spark Connect 实时笔记本: Spark 上的 pandas API 以下列表是本快速入门页面的内容 安装 支持的 Python 版本 使用 PyPI 使用 Conda 手动下载 从源代码安装 依赖项 快速入门: DataFrame DataFrame 创建 查看数据 选择和访问数据 应用函数 数据分组 数据导入/导出 使用 SQL 快速入门: Spark Connect 使用 Spark Connect 启动 Spark 服务器 连接到 Spark Connect 服务器 创建 DataFrame 快速入门: Spark 上的 Pandas API 对象创建 缺失数据 操作 分组 绘图 数据导入/导出 测试 PySpark 构建 PySpark 应用程序 测试 PySpark 应用程序 整合所有内容!