5.2 统计机器学习
5.2.1 统计机器学习的框架
输入:独立同分布的训练样本
回归问题:Y是连续的
分类问题:Y是类别
排序问题:Y是序数
目标函数:
损失函数:
期望风险:
5.2.2 回归及分类问题的最优函数
一、回归问题
输入:独立同分布的训练样本
目标函数:
线性回归:f是线性的
广义线性:f是非线性的
损失函数:
期望风险:
二、回归问题的最优函数
其中,
关于求导并令其等于0,即可得到上述问题的解:
最小化均方误差(MSE)的回归函数是由有条件分布的y的均值给出
三、分类问题
输入:独立同分布的训练样本
目标函数:
损失函数:
期望风险:
四、分类问题的最优函数
要求的是最小期望风险:
这里其实是求的分类错误的概率,因此需要将其最小化
因此,目标函数就是
最小化0-损失的贝叶斯分类器选择具有最大条件分布的类标签
5.2.3 过拟合和正则化
一、风险最小化
期望风险最小化:
经验风险最小化:
结构风险最小化:
上式中的称为正则项或惩罚函数
二、过拟合
5.2.4 泛化能力分析
最后更新于