3.4 Fisher线性判别

3.4.1 概述

出发点

  • 应用统计方法解决模式识别问题时,一再碰到的问题之一就是维数问题

  • 在低维空间里解析上或计算上行得通的方法,在高维空间里往往行不通

  • 因此,降低维数有时就会成为处理实际问题的关键

问题描述

  • 考虑把d维空间的样本投影到一条直线上,形成一维空间,即把维数压缩到一维

  • 然而,即使样本在d维空间里形成若干紧凑的互相分得开的集群,当把它们投影到一条直线上时,也可能会是几类样本混在一起而变得无法识别

  • 但是,在一般情况下,总可以找到某个方向,使在这个方向的直线上,样本的投影能分得开

Fisher判别方法所要解决的基本问题,就是如何根据实际情况找到一条最好的、最易于分类的投影线

3.4.2 降维的数学原理

从d维空间降到一维空间的一般数学变换方法:

3.4.3 Fisher准则

一、Fisher准则中的基本参量

在高维空间X中:

在一维空间Y中:

我们希望投影后,在一维Y空间中各类样本尽可能分得开些,同时各类样本内部尽量密集,实际上就是

  • 两类之间的均值相差越大越好

  • 类内的离散度越小越好

3.4.3 Fisher准则函数的定义

Fisher准则函数定义为:

而其中,样本均值可以写为:

则准则函数的分子可以写为:

而由于

因此分母可以写成:

3.4.4 最佳变换向量求解

由于需要使得均值之差(即分子)尽可能大,同时使得样本内离散度(即分母)尽可能小,故实际上就是要使得准则函数尽可能的大

拉格朗日乘数法

基本思想是将等式约束条件下的最优化问题转化为无约束条件下的最优化问题

问题: 设目标函数为

下的极值

描述: 引进函数

令分母等于非零常数,即:

则定义拉格朗日函数为:

令偏导数为0,有:

从而有:

由于只需要找最佳投影方向,因此可以忽略比例因子,有:

最后更新于