5.2 统计机器学习

5.2.1 统计机器学习的框架

输入：独立同分布的训练样本 $(x_i,y_i)\in X\times Y,i=1,2,\dots,N$
- 回归问题：Y是连续的
- 分类问题：Y是类别
- 排序问题：Y是序数
目标函数： $f\in \mathcal{F}$
损失函数： $L(f;x,y)$
期望风险： $\int L(f;x,y)dP(x,y)$

\begin{align} &\int (f(x)-y)^2dP(x,y) \nonumber \\ =&\iint(f(x) - y)^2p(x,y)dxdy \nonumber \\ =&\iint(f^2(x) - 2yf(x) + y^2)p(y\vert x)p(x)dxdy \nonumber \\ =&\int\left[\int (f^2(x) - 2yf(x) + y^2)p(y\vert x)p(x)dy\right]dx \nonumber \\ =&\int Q(f(x),y)p(x)dx \nonumber \end{align}

其中， $Q(f(x),y)=f^2(x)-2E(y\vert x)f(x) + E(y^2\vert x)$

关于 $f(x)$ 求导并令其等于0，即可得到上述问题的解：

f(x) = E(y\vert x)=\int yp(y\vert x)dy

最小化均方误差（MSE）的回归函数是由有条件分布 $p(y\vert x)$ 的y的均值给出

要求的是最小期望风险：

\begin{align} & \int I_{\{f(x)\neq y\}}dP(x,y) \nonumber \\ =& P(f(x)\neq y) \nonumber \\ =&\sum_{f(x)\neq C_i}P(C_i \vert x)p(x) \nonumber \end{align}

这里其实是求的分类错误的概率，因此需要将其最小化

因此，目标函数就是 $f(x)=\max\limits_{C_i}P(C_i\vert x)$

最小化0-损失的贝叶斯分类器选择具有最大条件分布 $p(y\vert x)$ 的类标签

\text{choose}\ C_i\ if P(C_i\vert x) = \max\limits_{k}P(C_k\vert x)

期望风险最小化：

R_{exp} = \int L(f;x,y)dP(x,y)

经验风险最小化：

R_{emp}(f)=\frac{1}{N}\sum_{i=1}^NL(f;x_i,y_i)

结构风险最小化：

R_{srm}(f) = \frac{1}{N}\sum_{i=1}^NL(f;x,y) + \lambda J(f)

上式中的 $\lambda J(f)$ 称为正则项或惩罚函数

最后更新于2年前

这有帮助吗？