从 Koalas 迁移到 Spark 上的 pandas API#

  • 导入的包名应从 databricks.koalas 更改为 pyspark.pandas

    # import databricks.koalas as ks
    import pyspark.pandas as ps
    
  • Koalas DataFrame 中的 DataFrame.koalas 已在 pandas-on-Spark DataFrame 中重命名为 DataFrame.pandas_on_sparkDataFrame.koalas 已在 Spark 4.0 中移除。

  • PySpark DataFrame 中被 Monkey-patched 的 DataFrame.to_koalas 已在 PySpark DataFrame 中重命名为 DataFrame.pandas_apiDataFrame.to_koalas 已在 Spark 4.0 中移除。

  • PySpark DataFrame 中被 Monkey-patched 的 DataFrame.to_pandas_on_spark 已在 PySpark DataFrame 中重命名为 DataFrame.pandas_apiDataFrame.to_pandas_on_spark 已在 Spark 4.0 中移除。

  • databricks.koalas.__version__ 已被移除。应改用 pyspark.__version__