4.1 模式类别可分性的测度

4.1.1 概述

特征选择和提取是模式识别中的一个关键问题

  • 如果将数目很多的测量值不做分析,全部直接用作分类特征,不但耗时,而且会影响到分类的效果,产生特征维数灾难问题

  • 为了设计出效果好的分类器,通常需要对原始的测量值集合进行分析,经过选择或变换处理,组成有效的识别特征

  • 在保证一定分类精度的前提下,减少特征维数,即进行降维处理,使分类器实现快速、准确和高效的分类

  • 为达到上述目的,关键是所提供的识别特征应具有很好的可分性,使分类器容易判别。为此,需对特征进行选择

    • 去掉模棱两可、不易判别的特征

    • 所提供的特征不要重复,即去掉那些相关性强且没有增加更多分类信息的特征

4.1.2 特征选择和提取

上述两种方法的目的都是为了在尽可能保留识别信息的前提下,降低特征空间的维数,已达到有效的分类。

4.1.3 模式类别可分性的测度

一、点到点之间的距离

在n维空间中,两点a、b之间的欧式距离为:

写成距离平方的形式:

二、点到点集之间的距离

三、类内距离

此外,可证明:

证明略

四、类内散布矩阵

其中

类内散布矩阵表示各样本点围绕其均值周围的散布情况

五、类间距离和类间散布矩阵

这两个模式的类间散布矩阵为:

扩展到三个以上的类别,类间散布矩阵可以写作:

六、多类模式集散布矩阵

多类情况类内散布矩阵,可以写成各类的类内散布矩阵的先验概率的加权和

有时,使用多类模式总体分布的散布矩阵来反映其可分性,即:

七、关系

总体散布矩阵是各类类内散布矩阵与类间散布矩阵之和

最后更新于