2.2 正态分布模式的贝叶斯分类器
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
具有M种模式类别的多变量正态密度函数为:
其中,
为模式向量的维度
为均值向量
为协方差矩阵
为协方差矩阵的行列式
表示对类别属于的模型的数学期望
是一个对称的正定阵,其对角线上的值代表元素的方差,非对角线上为元素之间的协方差。因此若元素之间全部独立时,多变量的正态概率密度函数可以简化为单个正态类密度函数的乘积。
由于类别的判别函数可以写为:
对于正态密度函数,可以取对数方便计算,则将正态类密度函数带入,可得:
判别函数是一个超二次曲面
对于正态分布模式的贝叶斯判别器,将模式类别之间用一个二此判别界面分开,即可得到最优的分类结果
当x是二维模式时,判别界面为二次曲线。如圆、椭圆、双曲线、抛物线等
当两个模式的协方差矩阵相等时,意味着它们具有相同的方差和相同的线性关系。这可以解释为两个模式具有相似的变化模式,并且它们之间的相关性和方向相同。这种情况下,可以说这两个模式在数据中具有相似的特征和变化方式。
判别界面为x的线性函数,为一超平面
当x是二维时,判别界面为一条直线
计算均值向量和协方差矩阵,由大数定律:
带入可得判别界面为:
贝叶斯分类是基于统计规则的
若样本量较少,一般难以获得最有效果
将其中与 无关的项去除,即可得到正态分布模式的贝叶斯判别函数:
假设两类模式的分布分别为和,则两类的判别函数分别为
判别界面是x的二次型方程
由于,上式可以简化为:
例:两类问题且模式均为正态分布的实例,求判别界面
其中, 为 中模式的数目, 表示第i个类别中的第j个模式,可得:
在特征 是多维向量时,朴素贝叶斯算法假设各个特征之间相互独立