最后更新于1年前
这有帮助吗?
输入:独立同分布的训练样本(xi,yi)∈X×Y,i=1,2,…,N(x_i,y_i)\in X\times Y,i=1,2,\dots,N(xi,yi)∈X×Y,i=1,2,…,N
回归问题:Y是连续的
分类问题:Y是类别
排序问题:Y是序数
目标函数:f∈Ff\in \mathcal{F}f∈F
损失函数:L(f;x,y)L(f;x,y)L(f;x,y)
期望风险:∫L(f;x,y)dP(x,y)\int L(f;x,y)dP(x,y)∫L(f;x,y)dP(x,y)
线性回归:f是线性的
广义线性:f是非线性的
损失函数:L(f;x,y)=(f(x)−y)2L(f;x,y)=(f(x)-y)^2L(f;x,y)=(f(x)−y)2
期望风险:∫(f(x)−y)2dP(x,y)\int (f(x)-y)^2dP(x,y)∫(f(x)−y)2dP(x,y)
要求的是最小期望风险:
这里其实是求的分类错误的概率,因此需要将其最小化
期望风险最小化:
经验风险最小化:
结构风险最小化:
其中,Q(f(x),y)=f2(x)−2E(y∣x)f(x)+E(y2∣x)Q(f(x),y)=f^2(x)-2E(y\vert x)f(x) + E(y^2\vert x)Q(f(x),y)=f2(x)−2E(y∣x)f(x)+E(y2∣x)
关于f(x)f(x)f(x)求导并令其等于0,即可得到上述问题的解:
最小化均方误差(MSE)的回归函数是由有条件分布p(y∣x)p(y\vert x)p(y∣x)的y的均值给出
损失函数:L(f;x,y)=I{f(x)≠y}L(f;x,y)=I_{\{f(x)\neq y\}}L(f;x,y)=I{f(x)=y}
期望风险:∫I{f(x)≠y}dP(x,y)=P(f(x)≠y)\int I_{\{f(x)\neq y\}}dP(x,y)=P(f(x)\neq y)∫I{f(x)=y}dP(x,y)=P(f(x)=y)
因此,目标函数就是f(x)=maxCiP(Ci∣x)f(x)=\max\limits_{C_i}P(C_i\vert x)f(x)=CimaxP(Ci∣x)
最小化0-损失的贝叶斯分类器选择具有最大条件分布p(y∣x)p(y\vert x)p(y∣x)的类标签
上式中的λJ(f)\lambda J(f)λJ(f)称为正则项或惩罚函数