logo
  • 概述
  • 入门
  • 用户指南
  • API 参考
  • 开发
  • 迁移指南
  • 安装
  • 快速入门:DataFrame
  • 快速入门:Spark Connect
  • 快速入门:Spark 上的 Pandas API
  • 测试 PySpark

入门¶

本页总结了设置和开始使用 PySpark 所需的基本步骤。在 Spark 文档的编程指南中,还有与其他语言共享的更多指南,例如快速入门。

有一些在线notebook,您无需任何其他步骤即可尝试 PySpark

  • 在线 Notebook:DataFrame

  • 在线 Notebook:Spark Connect

  • 在线 Notebook:Spark 上的 pandas API

以下是此快速入门页面的内容

  • 安装
    • 支持的 Python 版本
    • 使用 PyPI
    • 使用 Conda
    • 手动下载
    • 从源码安装
    • 依赖
  • 快速入门:DataFrame
    • DataFrame 创建
    • 查看数据
    • 选择和访问数据
    • 应用函数
    • 分组数据
    • 数据输入/输出
    • 使用 SQL
  • 快速入门:Spark Connect
    • 使用 Spark Connect 启动 Spark 服务器
    • 连接到 Spark Connect 服务器
    • 创建 DataFrame
  • 快速入门:Spark 上的 Pandas API
    • 对象创建
    • 缺失数据
    • 操作
    • 分组
    • 绘图
    • 数据输入/输出
  • 测试 PySpark
    • 构建 PySpark 应用程序
    • 测试您的 PySpark 应用程序
    • 全部整合!

上一页

PySpark 概述

下一页

安装

© 版权所有 .

使用 Sphinx 3.0.4 创建。