2.1 模式识别与机器学习的目标

判别式的分类器：

但是现实中，并非所有事件都是因果对应的，而是概率性的，此时判别式的模式识别就不再能解决问题。需要用模式集的统计特征来分类，使得分类器发生错误的概论最小。

P(A|B) = \frac{p(B|A)p(A)}{p(B)}

将实例带入其中，假设有两种模式 $\omega_1$ 和 $\omega_2$ ，需要分析 $x$ 来自其中哪个，则有

P(\omega_1|x)=\frac{p(x|\omega_1)p(\omega_1)}{p(x)} \\ P(\omega_2|x)=\frac{p(x|\omega_2)p(\omega_2)}{p(x)}

以其中第一个式子举例，

这里全概率计算时也可能是使用条件概率来计算的，但是在贝叶斯判别中将其称为全概率

实际上在使用中，由于每个后验概率的全概率是相同的，因此只需要比较分子即可，进一步说，比较似然函数和先验函数即可。

若P(\omega_1|x) > P(\omega_2|x)，则c\in \omega_1 \\ 若P(\omega_1|x)< P(\omega_2|x)，则c\in \omega_2

特别的，将 $l_{12}(x)=\dfrac{p(x|\omega_1)}{p(x|\omega_2)}$ 称为似然比，将 $\theta_{21} = \dfrac{P(\omega_2)}{P(\omega_1)}$ 称为似然比的判决阈值，则将上式简化可得：

若l_{12}(x) > \theta_{21}，则c\in \omega_1 \\ 若l_{12}(x) < \theta_{21}，则c\in \omega_2

此判别就称为贝叶斯判别。

例：假设对地震进行分析， $\omega_1$ 表示地震， $\omega_2$ 表示正常，根据统计得知 $P(\omega_1)=0.2$ 。而生物是否发生异常反应是与地震发生与否相关的，统计地震前一周生物是否发生异常，得到了以下数据：

那么某日观测到生物发生异常，问是否会发生地震？

由题意可知：

\begin{align} &P(\omega_1) = 0.2 \ \ P(\omega_2) = 0.8 \nonumber\\ &p(x=\text{异常}|\omega_1) =0.6 \ \ p(x=\text{正常}|\omega_1)=0.4\nonumber\\ &p(x=\text{异常}|\omega_2) =0.1 \ \ p(x=\text{正常}|\omega_2)=0.9\nonumber\\ \end{align}

带入贝叶斯公式，有：

\begin{align} P(\omega_1|x=异常) &= \frac{p(x=异常|\omega_1)P(\omega_1)}{p(x=异常)} \nonumber \\ &=\frac{p(x=异常|\omega_1)P(\omega_1)}{p(x=异常|\omega_1)P(\omega_1) + p(x=异常|\omega_2)P(\omega_2)} \nonumber \\ &= \frac{0.6\times0.2}{0.6\times0.2+0.1\times0.8} = 0.6 \nonumber \end{align}

计算似然比与判决阈值：

l_{12} = \frac{p(x=异常|\omega_1)}{p(x=异常|\omega_2)} = 6\\ \theta_{21} = \frac{P(\omega_2)}{P(\omega_1)} = 4

似然比大于判别阈值，因此会发生地震。

实际上，不同模式误判的代价是不一样的，因此需要对贝叶斯判别做一些修正，提出了条件平均风险 $r_j(x)$ 。

对于M类分类问题，若样本被判定为属于 $\omega_j$ 的平均风险为：

r_{ij}(x) = \sum_{i=1}^ML_{ij}P(\omega_i|x)

其中， $L_{ij}$ 表示误判的损失，称为将属于 $\omega_i$ 类的物品误判为 $\omega_j$ 的是非代价

一般而言，是非代价表现为一个对称阵，其中 $L_{ii}$ 一般为0或负数，表示判定成功，其他值表示判定失败，用正数表示。

按照贝叶斯公式，最小平均风险可以表示为：

r_{j}=\frac{1}{p(x)}\sum_{i=1}^{M} L_{ij} p(x|\omega_i)P(\omega_i)

其中全概率可以省去，因此最小平均风险可以表示为：

r_{j}=\sum_{i=1}^{M} L_{ij} p(x|\omega_i)P(\omega_i)

对于M分类的情况，若 $r_i(x) < r_j(x),j=1,2,\dots,M,\ j\neq i$ ，则有 $x \in \omega_i$

对于是非代价，取

L_{ij} = \begin{cases} 0& \text{when}\ i=j\\ 1& \text{when}\ i\neq j \end{cases}

则条件平均风险表示为：

\begin{align} r_{j}&=\sum_{i=1}^{M} L_{ij} p(x|\omega_i)P(\omega_i) \nonumber \\ &=L_{1j}p(x|\omega_1)P(\omega_1) + L_{2j}p(x|\omega_2)P(\omega_2) + \cdots + L_{Mj}p(x|\omega_M)P(\omega_M) \nonumber \\ &= \sum_{i=1}^Mp(x|\omega_i)P(\omega_i) - p(x|\omega_i)P(\omega_i) \nonumber \\ &=p(x)-p(x|\omega_i)P(\omega_i) \nonumber \end{align}

记 $d_i(x)=p(x|\omega_i)P(\omega_i),i=1,2,\dots,M$ ，则有若 $d_i(x) > r_j(x)$ ，则 $x \in \omega_i$

最后更新于1年前

这有帮助吗？