11.1 PGM简介

概率图模型(Probabilistic Graphical Models)

多元随机变量的条件独立性的概率模型

它的特点结构预测,即输入输出是“序列→序列”的形式,是元素具有依赖约束的序列预测:

y^=argmaxyp(yx)yY,Y很大\hat{\boldsymbol y} = \arg\max\limits_{\boldsymbol y}p(\boldsymbol{y\vert x})\quad \boldsymbol y\in \mathcal Y, \vert\mathcal Y\vert很大

而传统分类问题,y的取值代表分类,只有有限的几个值,并且不是序列:

y^=argmaxyp(yx)y{1,1}\hat y = \arg\max\limits_y p (y\vert x)\quad y\in\{1,-1\}

11.1.1 三大问题

  • 表示:能够用模型去描述随机变量之间依赖关系

    • 联合概率P(X)=P(x1,x2,,xD)=P(XO,XH)P(X) = P(x_1,x_2,\dots,x_D)=P(X_O,X_H)

    • 条件独立性{xi}{xj}{xn}\{x_i\}\perp \{x_j\}\vert\{x_n\}

  • 推断:给定观测数据,逆向推理,回答非确定性问题

    • 条件概率:用已知观测变量推测未知变量分布P(XHXO)P(X_H\vert X_O)

  • 学习:给定观测数据,学习最佳模型(结构、参数)

    • 联合概率最大化时的M参数:

Θ=argmaxθP(Xθ)\Theta^*=\arg\max\limits_\theta P(X\vert\theta)

一、表示

用图表示的概率分布

节点:表示随机变量/状态

:表示概率关系

类型

  • 有向概率图模型贝叶斯网络):因果关系

  • 无向概率图模型马尔可夫随机场):关联关系

二、推断

如何根据模型和给定的数据回答问题?

用已知的变量推断未知变量的分布:

  • 边缘概率p(xi)p(x_i)

  • 最大后验概率y=argmaxp(yx1,x2,,xD)y^*=\arg\max p(y\vert x_1,x_2,\dots,x_D)

三、学习

  • 参数学习:模型结构已知,求最佳参数

  • 结构学习:变量间依赖关系未知,从数据中学习

M=argmaxMMF(D;M)\mathcal M^*=\arg\max\limits_{\mathcal M\in M} F(\mathcal D;\mathcal M)

两类概率图模型

附录:概率论相关知识

最后更新于