1.1 概述

模式所指的不是事物本身，而是从事物获得的信息，因此，模式往往表现为具有时间和空间分布的信息

利用计算机对物理对象进行分类，在错误概率最小的条件下，使识别的结果尽量与客观物体相符合。

Y = F(X)

机器学习利用大量的训练数据可以获得更好的预测结果。

机器学习是研究如何构造理论、算法和计算机系统，让机器通过从数据中学习后可以进行如下工作：分类和识别事物、推理决策、预测未来等。

特征空间 ：从模式得到的对分类有用的度量、属性或基元构成的空间 解释空间 ：将c个类别表示为 $ωi∈Ω,i=1,2,⋯,c\omega_{i} \in \Omega, i=1,2,\cdots,c$ 。其中， $\Omega$ 为所属类别的集合，称为解释空间

监督学习：在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案，任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果
- 依靠已知所属类别的训练样本集，按它们特征向量的分布来确定假说（通常为一个判别函数），在判别函数确定之后能用它对未知的模式进行分类
- 对分类的模式要有足够的先验知识，通常需要采集足够数量的具有典型性的样本进行训练
非监督学习：在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说
- 在没有先验知识的情况下，通常采用聚类分析方法，基于“物以类聚”的观点，用数学方法分析各特征向量之间的距离及分散情况
- 如果特征向量集聚集若干个群，可按群间距离远近把它们划分成类
- 这种按各类之间的亲疏程度的划分，若事先能知道应划分成几类，则可获得更好的分类结果

数据聚类
- 目标：用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集
- 性质：是一种非监督学习的方法，解决方案是数据驱动的
统计分类
- 基于概率统计模型得到各类别的特征向量的分布，以取得分类的方法
- 特征向量分布的获得是基于一个类别已知的训练样本集
- 是一种监督分类的方法，分类器是概念驱动的
结构模式识别
神经网络
监督学习
无监督学习
半监督学习
增强学习
集成学习
深度学习
元学习
多任务学习
多标记学习
对抗学习

最后更新于2年前