6.1 有监督学习

6.1.1 什么是有监督学习

有标记的训练数据中学习推断函数。

  • 有监督学习算法分析训练数据,产生推断函数

  • 推断函数能够对新的样本进行预测

  • 最优的情形:算法能够准确地对没见过的样本进行正确地分类

  • 目标函数(target function) y=f(x)y=f(x)P(yx)P(y\vert x)

6.1.2 有监督学习的主要方法

一、产生式模型

  • 首先对联合分布进行推断:

p(x,y)=p(y)p(xy)p(x,y) = p(y)p(x\vert y)

其中p(y)p(y)先验概率,一半来自频次等等信息

  • 接下来使用贝叶斯定理计算目标函数条件分布p(yx)p(y\vert x)

p(yx)=p(x,y)p(y)=p(y)p(xy)p(y)p(xy)dy\begin{align} p(y\vert x) &=\frac{p(x,y)}{p(y)} \notag \\ & = \frac{p(y)p(x\vert y)}{\int p(y)p(x\vert y)dy} \notag \end{align}
  • 最后使用这个条件概率密度来进行预测

要确定某人所说语言的类别,产生式模型先学习所有语言,然后进行预测

二、判别式模型

  • 直接估计出概率分布P(yx)P(y\vert x)或条件概率密度函数p(yx)p(y\vert x)

  • 根据估计的函数确定输出

要确定某人所说语言的类别,判别式模型在不学习任何语言的情况下判别别语言的差异

三、判别函数

  • 寻找一个函数f(x)f(x),将每个输入直接映射到目标输出

  • 概率不起直接作用

    • 不能直接获取后验概率

    • f(x)f(x)的目的通常旨在近似条件分布p(yx)p(y\vert x)

最后更新于