📔
国科大模式识别与机器学习笔记 2023
  • 课程概况
  • 第一章 概述
    • 1.1 概述
  • 第二章 生成式分类器
    • 2.1 模式识别与机器学习的目标
    • 2.2 正态分布模式的贝叶斯分类器
    • 2.3 均值向量和协方差矩阵的参数估计
    • 附 第二章作业
  • 第三章 判别式分类器
    • 3.1 判别式分类器与生成式分类器
    • 3.2 线性判别函数
    • 3.3 广义线性判别函数
    • 3.4 Fisher线性判别
    • 3.5 感知器算法
    • 3.6 可训练的确定性分类器的迭代算法
    • 3.7 势函数法
    • 3.8 决策树
    • 附 第三章作业
  • 第四章 特征选择和提取
    • 4.1 模式类别可分性的测度
    • 4.2 特征选择
    • 4.3 离散K-L变换
    • 附 第四章作业
  • 第五章 统计机器学习
    • 5.1 机器学习简介
    • 5.2 统计机器学习
  • 第六章 有监督学习
    • 6.1 有监督学习
    • 6.2 回归任务
    • 6.3 分类问题
    • 附 第六章作业
  • 第七章 支持向量机
    • 7.1 线性支持向量机
    • 7.2 核支持向量机
    • 7.3 序列最小优化算法
    • 附 第七章作业
  • 第八章 聚类
    • 8.1 基本概念
    • 8.2 经典聚类算法
    • 附 第八章作业
  • 第九章 降维
    • 9.1 基本概念
    • 9.2 维度选择
    • 9.3 维度抽取
  • 第十章 半监督学习
    • 10.1 基本概念
    • 10.2 半监督学习算法
  • 第十一章 概率图模型
    • 11.1 PGM简介
    • 11.2 有向图模型(贝叶斯网络)
    • 11.3 无向图模型(马尔科夫随机场)
    • 11.4 学习和推断
    • 11.5 典型概率图模型
    • 附 第十一章作业
  • 第十二章 集成学习
    • 12.1 简介
    • 12.2 Bagging
    • 12.3 Boosting
    • 附 第十二章作业
由 GitBook 提供支持
在本页
  • 11.1.1 三大问题
  • 一、表示
  • 二、推断
  • 三、学习
  • 两类概率图模型
  • 附录:概率论相关知识

这有帮助吗?

在GitHub上编辑
  1. 第十一章 概率图模型

11.1 PGM简介

概率图模型(Probabilistic Graphical Models)

多元随机变量的条件独立性的概率模型

它的特点是结构预测,即输入输出是“序列→序列”的形式,是元素具有依赖约束的序列预测:

y^=arg⁡max⁡yp(y∣x)y∈Y,∣Y∣很大\hat{\boldsymbol y} = \arg\max\limits_{\boldsymbol y}p(\boldsymbol{y\vert x})\quad \boldsymbol y\in \mathcal Y, \vert\mathcal Y\vert很大y^​=argymax​p(y∣x)y∈Y,∣Y∣很大

而传统分类问题,y的取值代表分类,只有有限的几个值,并且不是序列:

y^=arg⁡max⁡yp(y∣x)y∈{1,−1}\hat y = \arg\max\limits_y p (y\vert x)\quad y\in\{1,-1\}y^​=argymax​p(y∣x)y∈{1,−1}

11.1.1 三大问题

  • 表示:能够用模型去描述随机变量之间依赖关系

    • 联合概率:P(X)=P(x1,x2,…,xD)=P(XO,XH)P(X) = P(x_1,x_2,\dots,x_D)=P(X_O,X_H)P(X)=P(x1​,x2​,…,xD​)=P(XO​,XH​)

    • 条件独立性:{xi}⊥{xj}∣{xn}\{x_i\}\perp \{x_j\}\vert\{x_n\}{xi​}⊥{xj​}∣{xn​}

  • 推断:给定观测数据,逆向推理,回答非确定性问题

    • 条件概率:用已知观测变量推测未知变量分布P(XH∣XO)P(X_H\vert X_O)P(XH​∣XO​)

  • 学习:给定观测数据,学习最佳模型(结构、参数)

    • 联合概率最大化时的M参数:

Θ∗=arg⁡max⁡θP(X∣θ)\Theta^*=\arg\max\limits_\theta P(X\vert\theta)Θ∗=argθmax​P(X∣θ)

一、表示

用图表示的概率分布

节点:表示随机变量/状态

边:表示概率关系

类型

  • 有向概率图模型(贝叶斯网络):因果关系

  • 无向概率图模型(马尔可夫随机场):关联关系

二、推断

如何根据模型和给定的数据回答问题?

用已知的变量推断未知变量的分布:

  • 边缘概率:p(xi)p(x_i)p(xi​)

  • 最大后验概率:y∗=arg⁡max⁡p(y∣x1,x2,…,xD)y^*=\arg\max p(y\vert x_1,x_2,\dots,x_D)y∗=argmaxp(y∣x1​,x2​,…,xD​)

三、学习

  • 参数学习:模型结构已知,求最佳参数

  • 结构学习:变量间依赖关系未知,从数据中学习

M∗=arg⁡max⁡M∈MF(D;M)\mathcal M^*=\arg\max\limits_{\mathcal M\in M} F(\mathcal D;\mathcal M)M∗=argM∈Mmax​F(D;M)

两类概率图模型

附录:概率论相关知识

上一页10.2 半监督学习算法下一页11.2 有向图模型(贝叶斯网络)

最后更新于1年前

这有帮助吗?