西瓜书总结

线性模型

regression: generalized linear model (link function)

classfication: sigmod -> LDA

(Q: classfication and discrimination )

多分类: OvO ,投票

OvR,唯一or置信度最高

MvM,ECOC(error correcting output codes) 纠错输出码

决策树

信息增益->基尼系数(划分后纯度尽可能高) CART

剪枝:前剪枝,后剪枝

对于连续值:选择划分点使用二分法计算信息增益

对于缺失值:引入缺失比例

多变量决策树:轴平行->斜决策树

神经网络

神经元->感知机:激活函数(sigmod) 权重 阈值

+隐藏层:多层网络 功能神经元 ->error backpropagation

局部最优: 多组参数初始化,模拟退火,随机梯度下降,遗传算法

深度学习:1. pre-train -> fine-tune 2.weight sharing

支持向量机

超平面划分 支持向量 最大间隔

线性不可分 ->高维映射 -> 核函数

支持向量回归:核方法

贝叶斯分类器

集成学习

同质 弱分类器 集成

聚类,分类,回归

留下评论

您的邮箱地址不会被公开。 必填项已用 * 标注