1.1 概述

一、概念

1.1 什么是模式?

模式所指的不是事物本身,而是从事物获得的信息,因此,模式往往表现为具有时间和空间分布的信息

1.2 模式的直观特征

  • 可观察性

  • 可区分性

  • 相似性

1.3 模式识别与机器学习的目的

利用计算机对物理对象进行分类,在错误概率最小的条件下,使识别的结果尽量与客观物体相符合。

Y=F(X)Y = F(X)
  • X:定义域取自特征集

  • Y:值域为类别的标号集

  • F:模式识别的判别方法

机器学习利用大量的训练数据可以获得更好的预测结果。

1.4 什么是机器学习?

机器学习是研究如何构造理论、算法和计算机系统,让机器通过从数据中学习后可以进行如下工作:分类和识别事物、推理决策、预测未来等。

二、方法

2.1 模式识别与机器学习的目标

  • 模式识别:在特征空间和解释空间之间找到一种映射关系,这种映射也称之为假说

  • 机器学习:针对某类任务T,用P衡量性能,根据经验来学习和自我完善,提高性能

特征空间 :从模式得到的对分类有用的度量、属性或基元构成的空间 解释空间 :将c个类别表示为ωiΩ,i=1,2,,cωiΩ,i=1,2,,cωi∈Ω,i=1,2,⋯,c\omega_{i} \in \Omega, i=1,2,\cdots,c。其中,Ω\Omega为所属类别的集合,称为解释空间

2.2 获得假说的两种方法

  • 监督学习在特征空间中找到一个与解释空间的结构相对应的假说。在给定模式下假定一个解决方案,任何在训练集中接近目标的假说也都必须在“未知”的样本上得到近似的结果

    • 依靠已知所属类别的训练样本集,按它们特征向量的分布来确定假说 (通常为一个判别函数),在判别函数确定之后能用它对未知的模式进行分类

    • 对分类的模式要有足够的先验知识,通常需要采集足够数量的具有典型性的样本进行训练

  • 非监督学习在解释空间中找到一个与特征空间的结构相对应的假说。这种方法试图找到一种只以特征空间中的相似关系为基础的有效假说

    • 在没有先验知识的情况下,通常采用聚类分析方法,基于“物以类聚”的观点,用数学方法分析各特征向量之间的距离及分散情况

    • 如果特征向量集聚集若干个群,可按群间距离远近把它们划分成类

    • 这种按各类之间的亲疏程度的划分,若事先能知道应划分成几类,则可获得更好的分类结果

2.3 主要的分类和学习方法

  • 数据聚类

    • 目标:用某种相似性度量的方法将原始数据组织成有意义的和有用的各种数据集

    • 性质:是一种非监督学习的方法,解决方案是数据驱动的

  • 统计分类

    • 基于概率统计模型得到各类别的特征向量的分布,以取得分类的方法

    • 特征向量分布的获得是基于一个类别已知的训练样本集

    • 是一种监督分类的方法,分类器是概念驱动的

  • 结构模式识别

  • 神经网络

  • 监督学习

  • 无监督学习

  • 半监督学习

  • 增强学习

  • 集成学习

  • 深度学习

  • 元学习

  • 多任务学习

  • 多标记学习

  • 对抗学习

最后更新于