Apache Spark 3.1.1 是 3.x 系列的第二个版本。此版本增加了 Python 类型注释和 Python 依赖管理支持,作为 Project Zen 的一部分。其他主要更新包括改进的 ANSI SQL 合规性支持、结构化流中的历史服务器支持、Kubernetes 的全面可用性 (GA) 以及 Kubernetes 和 Standalone 中的节点退役。此外,此版本继续专注于可用性、稳定性和完善,同时解决了大约 1500 个问题。
要下载 Apache Spark 3.1.1,请访问下载页面。您可以查阅 JIRA 以获取详细更改。我们在此处整理了高级更改列表,按主要模块分组。
亮点
ANSI SQL 兼容性增强
性能增强
可扩展性增强
连接器增强
功能增强
spark.sql.hive.metastore.jars
中的 HDFS 位置 (SPARK-32852)其他值得注意的变更
spark.ui.port
(SPARK-29465)spark.submit.waitForCompletion
配置,以控制 Standalone 集群模式下的 spark-submit 退出 (SPARK-31486)行为变更
请阅读每个组件的迁移指南:Spark Core 和 Spark SQL。
编程指南:Spark RDD 编程指南 和 Spark SQL、DataFrames 和 Datasets 指南。
Project Zen
其他值得注意的变更
行为变更
请阅读 PySpark 的迁移指南。
编程指南:PySpark 入门 和 PySpark 用户指南。
性能增强
功能增强
其他值得注意的变更
行为变更
请阅读 Structured Streaming 的迁移指南。
编程指南:Structured Streaming 编程指南。
亮点
其他值得注意的变更
行为变更
请阅读 MLlib 的迁移指南。
编程指南:机器学习库 (MLlib) 指南。
行为变更
请阅读迁移指南以了解详情。
编程指南:SparkR (R on Spark)。
编程指南:GraphX 编程指南。
最后但同样重要的是,如果没有以下贡献者,此版本是不可能实现的:Abhishek Dixit, Adam Binford, Ajith S, Akshat Bordia, Alessandro Patti, Alex Favaro, Ali Afroozeh, Ali Smesseim, Allison Wang, Ankit Srivastava, Anton Okolnychyi, Antonin Delpeuch, Artsiom Yudovin, Arwin Tio, Attila Zsolt Piros, Baohe Zhang, Bo Yang, Bo Zhang, Brandon Jiang, Bruce Robbins, Bryan Cutler, CC Highman, Chandni Singh, Chao Sun, Chen Zhang, Cheng Su, Chuliang Xiao, DB Tsai, Dale Clarke, Daniel Himmelstein, Daniel Moore, David Toneian, Denis Pyshev, Devesh Agrawal, Dilip Biswal, Dmitry Sabanin, Dongjoon Hyun, Du Ripeng, Emilian Bold, Eren Avsarogullari, Eric Lemmon, Eric Wu, Erik Krogen, Fabian Höring, Farhan Khan, Farooq Qaiser, Fei Wang, Fokko Driesprong, Frank Yin, Fuwang Hu, Gabor Somogyi, Gengliang Wang, Gera Shegalov, German Schiavon Matteo, Goki Mori, Guangxin Wang, Gustavo Martin Morcuende, Herman Van Hovell, Holden Karau, Huang Yi, Haejoon Lee, Huaxin Gao, Hyukjin Kwon, Izek Greenfield, Jackey Lee, Jacob Kim, Jalpan Randeri, Jatin Puri, Jiaan Geng, Jinxin Tang, Josh Soref, Jonathan Lafleche, Jungtaek Lim, Karen Feng, Karol Chmist, Kaxil Naik, Kazuaki Ishizaki, Ke Jia, Keiji Yoshida, Kent Yao, Kevin Su, Kevin Wang, Koert Kuipers, Kousuke Saruta, Kyle Bendickson, Lantao Jin, Leanken Lin, Liang Zhang, Liang-Chi Hsieh, Linhong Liu, Lipeng Zhu, Lu Lu, Luca Canali, Maciej Szymkiewicz, Manu Zhang, Marcelo Vanzin, Maryann Xue, Matthew Cheah, Maxim Gekk, Michael Chirico, Michael Munday, Michał Wieleba, Min Shen, Nan Zhu, Nicholas Chammas, Nicholas Marcott, Nik Vanderhoof, Onur Satici, Pablo Langa, Pascal Gillet, Paul Reidy, Pavithra Ramachandran, Pedro Rossi, Peter Toth, Philipse Guo, Piotr Grzegorski, Prakhar Jain, Prashant Sharma, Qianyang Yu, Qilong Su, Rajat Ahuja, Rakesh Raushan, Rameshkrishnan Muthusamy, Raphael Auv, Richard Penney, Robert (Bobby) Evans, Rohit Mishra,Ruifeng Zheng, Ryan Blue, Ryotaro Tsuzuki, Samir Khan, Samuel Souza, Sandeep Katta, Sander Goos, Saurabh Chawla, Sean Owen, Seongjin Cho, Shane Knapp, Shanyu Zhao, Shaoyun Chen, Shixiong Zhu, Shruti Gumma, Srinivas Rishindra Pothireddi, Stavros Kontopoulos, StefanXiepj, Stijn De Haes, Stuart White, Sudharshann D, Sunitha Kambhampati, Takeshi Yamamuro, Takuya UESHIN, Tanel Kiis, Tathagata Das, Terry Kim, Thomas Graves, Tianshi Zhu, Tom Howland, Tom Van Bussel, Udbhav Agrawal, Uncle Gen, Utkarsh Agarwal, Venkata Krishnan Sowrirajan, Vlad Glinsky, Warren Zhu, Weichen Xu, Wenchen Fan, William Hyun, Wing Yew Poon, Xianyin Xin, Xiao Li, Xiduo You, Xingbo Jiang, Xinrong Meng, Xinyi Yu, Xuedong Luan, Yang Jie, Yaroslav Tkachenko, Ye Zhou, Yi Wu, Yi Zhu, Yu Zhong, Yuanjian Li, Yuexin Zhang, Yuming Wang, Yuning Zhang, Zhen Li, Zhenhua Wang, Zhicheng Jin, Zirui Xu, Zuo Dao, akiyamaneko, artiship, cristichircu, dzlab, huangtianhua, liucht-inspur, manubatham20, waitinfuture, wang-zhun, yzjg