3.3.1 基本思想
假设一个模式集{x},在模式空间x中线性不可分,但是在模式空间x∗中线性可分,其中x∗中的各分量是x的单值实函数,且x∗的维度高于x的维度,即:
x∗=(f1(x),f2(x),…,fk(x),1)T k>n 则若有非线性判别函数:
d(x)=w1f1(x)+w2f2(x)+⋯+wkfk(x)+wk+1 该判别函数可以表示为:
d(x∗)=wTx∗ 此时非线性判别函数已经被转换为广义线性
3.3.2 f(x)的选择
一、一次函数
若取fi(x)为一次函数,则变换后的模式x∗=x,x∗的维数k等于x的维数n,此时广义化后的线性判别式仍然为:
d(x)=wTx=wn+1 二、二次多项式函数
设x的维度为n,则原判别函数为:
d(x)=j=1∑nwjjxj2+j=1∑n−1k=j+1∑nwjkxjxk+j=1∑nwjxj+wn+1 式中包含x各分量的二次项、一次项和常数项,其中:
二次项2n(n−1)个
总的项数为:
n+2n(n−1)+n+1=2(n+1)(n+2)>n 显然对于x∗,其维数大于x的原维数,则x∗的各分量一般化为:
fi(x)=xp1sxp2t, p1,p2=1,2,…,n, s,t=0,1 三、r次多项式
若fi(x)为r次多项式函数,x为n维模式,则有:
fi(x)=xp1s1xp2s2⋯xprsr, p1,p2,…,pr=1,2,…,n, s1,s2,…,sr=0,1 此时,判别函数d(x)可由以下递推关系给出:
常数项: d(0)(x)一次项: d(1)(x)二次项: d(2)(x)r次项: d(r)(x)=wn+1=p1=1∑nwp1xp1+d(0)(x)=p1=1∑np2=p1∑nwp1p2xp1xp2+d(1)(x)⋯=p1=1∑np2=p1∑n⋯pr=pr−1∑nwp1p2…prxp1xp2…xpr+d(r−1)(x) 对于n维x向量,若用r次多项式,d(x)的权系数的总项数为:
Nw=Cn+rr=r!n!(n+r)! 可以看出d(x)的项数随着r和n的增大而迅速增大,若采用次数较高的多项式变换,即使原来x的维数不高,也会使得变换后的x∗维数很高,给分类带来困难
实际情况可只取r=2,或只选多项式的一部分,例如r=2时只取二次项,略去一次项,以减少x∗的维数。
3.3.3 分段线性判别函数
一、出发点
线性判别函数在进行分类决策时是最简单有效的,但在实际应用中,常常会出现不能用线性判别函数直接进行分类的情况
采用广义线性判别函数的概念,可以通过增加维数来得到线性判别,但维数的大量增加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难,增加计算的复杂性
引入分段线性判别函数的判别过程,它比一般的线性判别函数的错误率小,但又比非线性判别函数简单
简单来说,就是用一个分段函数来逼近非线性的判别函数
二、最小距离分类器
设μ1和μ2为两个模式ω1和ω2的聚类中心,定义决策规则:
∥x−μ1∥2−∥x−μ2∥2={<0>0x∈ω1x∈ω2 此时的决策面是两类期望连线的垂直平分面,这样的分类器称为最小距离分类器