监督学习方法总结

方法 适用问题 模型特点 类型 学习策略 损失函数 学习算法
感知机 二分类 分离超平面 判别 极小化误分类点到超平面距离 误分点到超平面距离 SGD
K近邻法 多分类, 回归 特征空间, 样本点 判别 - - -
朴素Bayes法 多分类 特征与类别的联合概率分布, 条件独立假设 生成 MLE , 最大后验概率估计 Log-loss 概率计算公式, EM 算法
决策树 多分类, 回归 分类树, 回归树 判别 正则化的 MLE Log-loss 特征选择, 生成, 剪枝
Logistic回归, 最大熵模型 多分类 特征条件下类别的条件概率分布, 对数线性模型 判别 (正则化的) MLE Logistic Loss 改进的迭代尺度算法, 梯度下降, 拟牛顿法
SVM 二分类 分离超平面, 函数/几何间隔, 核技巧 判别 极小化 hinge-loss, 软间隔最大化 Hinge loss SMO
提升方法 二分类 弱分类器的线性组合 判别 极小化加法模型的指数损失 指数损失 前向分步加法算法, AdaBoost
EM算法 概率模型参数估计 含隐变量概率模型 - MLE, 最大后验概率估计 Log-loss 迭代算法 (EM 算法)
隐Markov模型 标注 观测序列与状态序列的联合概率分布模型 生成 MLE, 最大后验概率估计 Log-loss 概率计算公式, EM 算法
条件随机场 标注 状态序列条件下观测序列的条件概率分布, 对数线性模型 判别 (正则化的) MLE Log-loss 改进的迭代尺度算法, 梯度下降, 拟牛顿法