2.3 均值向量和协方差矩阵的参数估计
最后更新于
这有帮助吗?
最后更新于
这有帮助吗?
在贝叶斯分类器中,构造分类器需要知道类概率密度函数
如果按先验知识已知其分布,则只需知道分布的参数即可
例如:类概率密度是正态分布,它完全由其均值向量和协方差矩阵所确定
对均值向量和协方差矩阵的估计即为贝叶斯分类器中的一种参数估计问题
参数估计的两种方式
一种是将参数作为非随机变量来处理,例如矩估计就是一种非随机参数的估计
另一种是随机参数的估计,即把这些参数看成是随机变量,例如贝叶斯参数估计
设模式的概率密度函数为,则均值的定义为:
其中,,
由大数定律有,均值的估计量为:
协方差矩阵为:
其中,每个元素的定义为:
将协方差矩阵写成向量的方式为:
则根据大数定律,协方差的估计量可以写为:
假设已经计算了N个样本的均值估计量,此时若新增一个样本,则新的估计量为:
协方差与均值类似,当前已知
则新加入一个样本后:
按这些估计量统计特性的先验知识,可以先粗略地预选出它们的密度函数
具体而言,就是:
其中,、和、分别为x、m的第i和j个分量。
迭代的初始化取
由于,因此有
将概率密度函数的参数估计量看成是随机变量,它可以是纯量、向量或矩阵
通过训练模式样本集,利用贝叶斯公式设计一个迭代运算过程求出参数的后验概率密度
当后验概率密度函数中的随机变量的确定性提高时,可获得较准确的估计量
其中,先验概率由迭代计算而来,而全概率则由以下方式计算:
因此,实际上需要知道的就是初始的
假设有一个模式样本集,其概率密度函数是单变量正态分布,均值待求,即:
给出N个训练样本,用贝叶斯学习计算其均值估计量。
对于初始条件,设 ,,由贝叶斯公式可得:
此处表示整个模式空间,由于每一次迭代是逐个从样本子集中抽取,因此N次运算是独立的,上式由此可以写成:
将上式中所有与无关的变量并入常数项和,则是平方函数的指数集合,仍是正态密度函数,写为的形式,有:
解出和,得:
即根据对样本的观测,求得均值的后验概率密度为,其中:
是先验信息()与训练样本所给信息()适当结合的结果,是N个训练样本对均值的先验估计的补充
是对这个估计的不确定性的度量,随着N的增加而减少,因此当时,,代入上式可知只要,则当N数量足够大时,趋于样本均值的估计量