判别式的分类器:
即建立一个映射y=F(x)
但是现实中,并非所有事件都是因果对应的,而是概率性的,此时判别式的模式识别就不再能解决问题。需要用模式集的统计特征来分类,使得分类器发生错误的概论最小。
2.1.1 贝叶斯判别原则
贝叶斯公式
P(A∣B)=p(B)p(B∣A)p(A) 贝叶斯判别
将实例带入其中,假设有两种模式ω1和ω2,需要分析x来自其中哪个,则有
P(ω1∣x)=p(x)p(x∣ω1)p(ω1)P(ω2∣x)=p(x)p(x∣ω2)p(ω2) 以其中第一个式子举例,
要求的 P(ω1∣x) 即为 x∈ω1 的概率,称为后验概率
p(ω1) 是来自数据集和历史数据,称为先验概率
p(x∣ω1) 是x的条件概率,这里也称为似然函数
这里全概率计算时也可能是使用条件概率来计算的,但是在贝叶斯判别中将其称为全概率
实际上在使用中,由于每个后验概率的全概率是相同的,因此只需要比较分子即可,进一步说,比较似然函数和先验函数即可。
若P(ω1∣x)>P(ω2∣x),则c∈ω1若P(ω1∣x)<P(ω2∣x),则c∈ω2 特别的,将l12(x)=p(x∣ω2)p(x∣ω1)称为似然比,将θ21=P(ω1)P(ω2)称为似然比的判决阈值,则将上式简化可得:
若l12(x)>θ21,则c∈ω1若l12(x)<θ21,则c∈ω2 此判别就称为贝叶斯判别。
2.1.2 贝叶斯最小风险判别
实际上,不同模式误判的代价是不一样的,因此需要对贝叶斯判别做一些修正,提出了条件平均风险 rj(x)。
M类分类问题的平均条件风险
对于M类分类问题,若样本被判定为属于ωj的平均风险为:
rij(x)=i=1∑MLijP(ωi∣x) 其中,Lij表示误判的损失,称为将属于ωi类的物品误判为ωj的是非代价
一般而言,是非代价表现为一个对称阵,其中Lii一般为0或负数,表示判定成功,其他值表示判定失败,用正数表示。
最小平均风险
按照贝叶斯公式,最小平均风险可以表示为:
rj=p(x)1i=1∑MLijp(x∣ωi)P(ωi) 其中全概率可以省去,因此最小平均风险可以表示为:
rj=i=1∑MLijp(x∣ωi)P(ωi) 贝叶斯最小风险判别
对于M分类的情况,若 ri(x)<rj(x),j=1,2,…,M, j=i ,则有x∈ωi
对于是非代价,取
Lij={01when i=jwhen i=j 则条件平均风险表示为:
rj=i=1∑MLijp(x∣ωi)P(ωi)=L1jp(x∣ω1)P(ω1)+L2jp(x∣ω2)P(ω2)+⋯+LMjp(x∣ωM)P(ωM)=i=1∑Mp(x∣ωi)P(ωi)−p(x∣ωi)P(ωi)=p(x)−p(x∣ωi)P(ωi) 记di(x)=p(x∣ωi)P(ωi),i=1,2,…,M,则有若di(x)>rj(x),则x∈ωi