从 Koalas 迁移到 Spark 上的 pandas API#

  • 导入包的名称应从 databricks.koalas 更改为 pyspark.pandas

    # import databricks.koalas as ks
    import pyspark.pandas as ps
    
  • Koalas DataFrame 中的 DataFrame.koalas 已在 Spark 上的 pandas DataFrame 中重命名为 DataFrame.pandas_on_sparkDataFrame.koalas 已从 Spark 4.0 版本起被移除。

  • PySpark DataFrame 中通过猴子补丁(Monkey-patched)实现的 DataFrame.to_koalas 已重命名为 PySpark DataFrame 中的 DataFrame.pandas_apiDataFrame.to_koalas 已从 Spark 4.0 版本起被移除。

  • PySpark DataFrame 中通过猴子补丁(Monkey-patched)实现的 DataFrame.to_pandas_on_spark 已重命名为 PySpark DataFrame 中的 DataFrame.pandas_apiDataFrame.to_pandas_on_spark 已从 Spark 4.0 版本起被移除。

  • databricks.koalas.__version__ 已被移除。应改为使用 pyspark.__version__