分类与回归 - 基于 RDD 的 API

spark.mllib 包支持用于二元分类多元分类回归分析的多种方法。下表概述了每种问题类型支持的算法。

问题类型支持的方法
二元分类线性 SVM、逻辑回归、决策树、随机森林、梯度提升树、朴素贝叶斯
多元分类逻辑回归、决策树、随机森林、朴素贝叶斯
回归线性最小二乘、Lasso、岭回归、决策树、随机森林、梯度提升树、保序回归

有关这些方法的更多详细信息请参见此处