分类与回归 - 基于 RDD 的 API

spark.mllib 包支持多种用于二元分类多元分类回归分析的方法。 下表概述了每种问题类型支持的算法。

问题类型支持的方法
二元分类线性 SVM、logistic 回归、决策树、随机森林、梯度提升树、朴素贝叶斯
多元分类logistic 回归、决策树、随机森林、朴素贝叶斯
回归线性最小二乘法、Lasso、岭回归、决策树、随机森林、梯度提升树、保序回归

有关这些方法的更多详细信息可以在这里找到