# 3.3 广义线性判别函数

## 3.3.1 基本思想

假设一个模式集$${x}$$，在模式空间$$x$$中<mark style="color:blue;">**线性不可分**</mark>，但是在模式空间$$x^*$$中<mark style="color:blue;">**线性可分**</mark>，其中$$x^*$$中的各分量是$$x$$的<mark style="color:purple;">**单值实函数**</mark>，且$$x^\*$$的维度<mark style="color:orange;">**高于**</mark>$$x$$的维度，即：

$$
x^\* = (f\_1(x),f\_2(x),\dots,f\_k(x),1)^T\ \ \ k>n
$$

则若有非线性判别函数：

$$
d(x)=w\_1f\_1(x) + w\_2f\_2(x) + \cdots + w\_kf\_k(x) + w\_{k+1}
$$

该判别函数可以表示为：

$$
d(x^*)=w^Tx^*
$$

此时非线性判别函数已经被转换为<mark style="color:orange;">**广义线性**</mark>

## 3.3.2 f(x)的选择

### 一、一次函数

若取$$f\_i(x)$$为一次函数，则变换后的模式$$x^*=x$$，$$x^*$$的维数k等于$$x$$的维数n，此时广义化后的线性判别式仍然为：

$$
d(x) = w^Tx = w\_{n+1}
$$

### 二、二次多项式函数

设x的维度为n，则原判别函数为：

$$
d(x) = \sum\_{j=1}^nw\_{jj}x\_j^2 + \sum\_{j=1}^{n-1}\sum\_{k=j+1}^nw\_{jk}x\_jx\_k + \sum\_{j=1}^nw\_jx\_j + w\_{n+1}
$$

式中包含$$x$$各分量的二次项、一次项和常数项，其中：

* 平方项$$n$$个
* 二次项$$\dfrac{n(n-1)}{2}$$个
* 一次项$$n$$个
* 常数项1个

总的项数为：

$$
n+\frac{n(n-1)}{2} + n +1 = \frac{(n+1)(n+2)}{2} > n
$$

显然对于$$x^*$$，其维数大于$$x$$的原维数，则$$x^*$$的各分量一般化为：

$$
f\_i(x) = x\_{p\_1}^sx\_{p\_2}^t,\ p\_1,p\_2=1,2,\dots,n,\ s,t=0,1
$$

### 三、r次多项式

若$$f\_i(x)$$为r次多项式函数，x为n维模式，则有：

$$
f\_i(x) = x\_{p\_1}^{s\_1}x\_{p\_2}^{s\_2}\cdots x\_{p\_r}^{s\_r},\ p\_1,p\_2,\dots,p\_r=1,2,\dots,n,\ s\_1,s\_2,\dots,s\_r=0,1
$$

此时，判别函数$$d(x)$$可由以下递推关系给出：

$$
\begin{align} 常数项:\ d^{(0)}(x)&=w\_{n+1} \nonumber \ 一次项:\ d^{(1)}(x)&=\sum\_{p\_1=1}^nw\_{p\_1}x\_{p\_1} + d^{(0)}(x) \nonumber \ 二次项:\ d^{(2)}(x)&=\sum\_{p\_1=1}^n\sum\_{p\_2=p\_1}^nw\_{p\_1p\_2}x\_{p\_1}x\_{p\_2} + d^{(1)}(x) \nonumber \ & \cdots \nonumber \ r次项:\ d^{(r)}(x)&=\sum\_{p\_1=1}^n\sum\_{p\_2=p\_1}^n\dots\sum\_{p\_r=p\_{r-1}}^nw\_{p\_1p\_2\dots p\_r}x\_{p\_1}x\_{p\_2}\dots x\_{p\_r} + d^{(r-1)}(x) \nonumber \end{align}
$$

{% hint style="info" %}
例：当取r=2，n=2时，写出判别函数

$$
\begin{align} \text{常数项}:\ d^{(0)}(x)&=w\_{n+1} \nonumber \ &=w\_3 \nonumber \ \text{一次项}:\ d^{(1)}(x)&=\sum\_{p\_1=1}^nw\_{p\_1}x\_{p\_1} + d^{(0)}(x) \nonumber \ &=w\_1x\_1+w\_2x\_2+w\_3 \nonumber \ \text{二次项}:\ d^{(2)}(x)&=\sum\_{p\_1=1}^n\sum\_{p\_2=p\_1}^nw\_{p\_1p\_2}x\_{p\_1}x\_{p\_2} + d^{(1)}(x) \nonumber \ &=w\_{11}x\_1^2 + w\_{12}x\_1x\_2 + w\_{22}x\_2^2 + w\_1x\_1+w\_2x\_2+w\_3 \nonumber \ \end{align}
$$
{% endhint %}

### 四、$$d(x)$$的项数

对于n维x向量，若用r次多项式，$$d(x)$$的权系数的总项数为：

$$
N\_w=C\_{n+r}^r=\frac{(n+r)!}{r!n!}
$$

可以看出$$d(x)$$的<mark style="color:orange;">**项数随着r和n的增大而迅速增大**</mark>，若采用次数较高的多项式变换，即使原来$$x$$的维数不高，也会使得变换后的$$x^\*$$维数很高，给分类带来困难

{% hint style="warning" %}
实际情况可只取r=2，或只选多项式的一部分，例如r=2时只取二次项，略去一次项，以减少$$x^\*$$的维数。
{% endhint %}

{% hint style="info" %}
例：设有一维样本空间X，所希望的分类是若$$x\leq b$$或$$x\geq a$$，则$$x \in \omega\_1$$；若$$b\<x\<a$$，$$x \in \omega\_1$$

<img src="https://4038108263-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FQvX394T4tC7TQRUQRFUu%2Fuploads%2Fgit-blob-49b306d08ae5045363cd2d4ac6be12d2f99f5dce%2F3.3.1.png?alt=media" alt="" data-size="original">

显然没有一个线性判别函数能在一维空间中解决上述问题。

要在一维空间中分类，只有定义判别函数：

$$
d(x) = (x-a)(x-b) = x^2 - (a+b)x + ab
$$

对应到二维空间，令：

$$
x\_1 = f\_1(x) = x^2 \ x\_2 = f\_2(x) = x
$$

则可以得到线性判别函数：

$$
d(x) = x\_1 - (a+b)x\_2 + ab = w^Tx
$$

其中

$$
x = (x\_1,\ x\_2,\ 1)^T \ w = (1,\ -(a+b),\ ab)^T
$$
{% endhint %}

## 3.3.3 分段线性判别函数

### 一、出发点

* 线性判别函数在进行分类决策时是最简单有效的，但在实际应用中，常常会出现不能用线性判别函数直接进行分类的情况
* 采用广义线性判别函数的概念，可以通过增加维数来得到线性判别，但维数的大量增加会使在低维空间里在解析和计算上行得通的方法在高维空间遇到困难，增加计算的复杂性
* 引入分段线性判别函数的判别过程，它比一般的线性判别函数的错误率小，但又比非线性判别函数简单

{% hint style="warning" %}
简单来说，就是用一个分段函数来逼近非线性的判别函数
{% endhint %}

### 二、最小距离分类器

设$$\mu\_1$$和$$\mu\_2$$为两个模式$$\omega\_1$$和$$\omega\_2$$的聚类中心，定义决策规则：

$$
\Vert x- \mu\_1\Vert^2-\Vert x - \mu\_2\Vert^2= \begin{cases} <0 & x\in \omega\_1 \ >0 & x\in\omega\_2 \end{cases}
$$

此时的决策面是两类期望连线的<mark style="color:purple;">**垂直平分面**</mark>，这样的分类器称为<mark style="color:orange;">**最小距离分类器**</mark>

![](https://4038108263-files.gitbook.io/~/files/v0/b/gitbook-x-prod.appspot.com/o/spaces%2FQvX394T4tC7TQRUQRFUu%2Fuploads%2Fgit-blob-8436d64160b7abffff08f52689b389ddc446b722%2F3.3.2.png?alt=media)
