2.2 正态分布模式的贝叶斯分类器
2.2.1 M种模式类别的正态密度函数
具有M种模式类别的多变量正态密度函数为:
其中,
为模式向量的维度
为均值向量
为协方差矩阵
为协方差矩阵的行列式
表示对类别属于的模型的数学期望
是一个对称的正定阵,其对角线上的值代表元素的方差,非对角线上为元素之间的协方差。因此若元素之间全部独立时,多变量的正态概率密度函数可以简化为单个正态类密度函数的乘积。
由于类别的判别函数可以写为:
对于正态密度函数,可以取对数方便计算,则将正态类密度函数带入,可得:
将其中与 无关的项去除,即可得到正态分布模式的贝叶斯判别函数:
特点
判别函数是一个超二次曲面
对于正态分布模式的贝叶斯判别器,将模式类别之间用一个二此判别界面分开,即可得到最优的分类结果
2.2.2 符合正态分布的二分类问题
当 时
假设两类模式的分布分别为和,则两类的判别函数分别为
判别界面是x的二次型方程
当x是二维模式时,判别界面为二次曲线。如圆、椭圆、双曲线、抛物线等
当 时
当两个模式的协方差矩阵相等时,意味着它们具有相同的方差和相同的线性关系。这可以解释为两个模式具有相似的变化模式,并且它们之间的相关性和方向相同。这种情况下,可以说这两个模式在数据中具有相似的特征和变化方式。
由于,上式可以简化为:
判别界面为x的线性函数,为一超平面
当x是二维时,判别界面为一条直线
贝叶斯分类是基于统计规则的
若样本量较少,一般难以获得最有效果
2.2.3 朴素贝叶斯
在特征 是多维向量时,朴素贝叶斯算法假设各个特征之间相互独立
最后更新于
这有帮助吗?