分类与回归 - 基于 RDD 的 API

spark.mllib 包支持各种方法用于 二元分类多元分类回归分析。下表概述了每种问题类型支持的算法。

问题类型支持的方法
二元分类线性 SVM、逻辑回归、决策树、随机森林、梯度提升树、朴素贝叶斯
多元分类逻辑回归、决策树、随机森林、朴素贝叶斯
回归线性最小二乘、Lasso、岭回归、决策树、随机森林、梯度提升树、等距回归

这些方法的更多详细信息可以在这里找到