为了让社区能够广泛测试即将发布的 Spark 4.0 版本,Apache Spark 社区发布了 Spark 4.0 的预览版。这个预览版在 API 和功能方面都不是一个稳定的版本,而是为了让社区能够尽早访问代码,从而为 Spark 4.0 做好准备。 如果您想测试此版本,请下载并使用邮件列表或 JIRA 发送反馈。
Spark 4.0 中添加了许多令人兴奋的新功能,包括默认启用 ANSI 模式、Python 数据源、多态 Python UDTF、字符串排序支持、新的 VARIANT 数据类型、流式状态存储数据源、结构化日志记录、默认使用 Java 17 等等。
我们要感谢我们的贡献者和用户对本次发布的贡献和早期反馈。 没有你们,这次发布是不可能实现的。
要下载 Spark 4.0.0-preview1,请访问下载页面。它也可以在 PyPI 中找到,版本名称为 “4.0.0.dev1”。