📔
国科大模式识别与机器学习笔记 2023
  • 课程概况
  • 第一章 概述
    • 1.1 概述
  • 第二章 生成式分类器
    • 2.1 模式识别与机器学习的目标
    • 2.2 正态分布模式的贝叶斯分类器
    • 2.3 均值向量和协方差矩阵的参数估计
    • 附 第二章作业
  • 第三章 判别式分类器
    • 3.1 判别式分类器与生成式分类器
    • 3.2 线性判别函数
    • 3.3 广义线性判别函数
    • 3.4 Fisher线性判别
    • 3.5 感知器算法
    • 3.6 可训练的确定性分类器的迭代算法
    • 3.7 势函数法
    • 3.8 决策树
    • 附 第三章作业
  • 第四章 特征选择和提取
    • 4.1 模式类别可分性的测度
    • 4.2 特征选择
    • 4.3 离散K-L变换
    • 附 第四章作业
  • 第五章 统计机器学习
    • 5.1 机器学习简介
    • 5.2 统计机器学习
  • 第六章 有监督学习
    • 6.1 有监督学习
    • 6.2 回归任务
    • 6.3 分类问题
    • 附 第六章作业
  • 第七章 支持向量机
    • 7.1 线性支持向量机
    • 7.2 核支持向量机
    • 7.3 序列最小优化算法
    • 附 第七章作业
  • 第八章 聚类
    • 8.1 基本概念
    • 8.2 经典聚类算法
    • 附 第八章作业
  • 第九章 降维
    • 9.1 基本概念
    • 9.2 维度选择
    • 9.3 维度抽取
  • 第十章 半监督学习
    • 10.1 基本概念
    • 10.2 半监督学习算法
  • 第十一章 概率图模型
    • 11.1 PGM简介
    • 11.2 有向图模型(贝叶斯网络)
    • 11.3 无向图模型(马尔科夫随机场)
    • 11.4 学习和推断
    • 11.5 典型概率图模型
    • 附 第十一章作业
  • 第十二章 集成学习
    • 12.1 简介
    • 12.2 Bagging
    • 12.3 Boosting
    • 附 第十二章作业
由 GitBook 提供支持
在本页
  • 5.1.1 统计机器学习
  • 5.1.2 机器学习三要素
  • 5.1.3 机器学习的特点
  • 5.1.4 机器学习的分类

这有帮助吗?

在GitHub上编辑
  1. 第五章 统计机器学习

5.1 机器学习简介

桑克(R. Shank)

“一台计算机若不会学习,就不能说它具有智能。”

5.1.1 统计机器学习

  • 机器学习

    • 更强调面向算法

    • 机器学习强调算法的结果要好,所以机器学习很关注损失函数

  • 统计学

    • 更偏重于面向模型

    • 统计学要先扔出来一大堆模型假设,然后站在模型上面通 过严格的数学推导做出结果

统计机器学习:是基于数据构建概率统计模型并运用模型对数据进行预测分析的一门学科

5.1.2 机器学习三要素

"A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E"

--Tom M. Mitchell

  • 经验(E):训练数据

  • 模型(T):—需要学习的目标函数

  • 学习算法: 怎么样从经验中推断出模型

  • 评价(P):测试数据

机器学习的任务:Improve on task(T), with respect to performance metric(P), based on experience(E)

5.1.3 机器学习的特点

  • 数据大量、廉价;知识昂贵、稀少

  • 数据产生过程的细节是未知的,但是数据产生的过程不是完全随机的

  • 通过利用数据中的某些模式或规律从数据中学习模型:反推数据生成路径

  • 模型通常不是完整过程的精确复制品,而是一种良好且有用的近似:(George Box: “All models are wrong, but some are useful.”)

  • 模型可以描述从数据中获取知识,或预测将来(具有预测性),或者两者兼而有之

  • 几乎所有的科学都关注于用模型拟合数据:推理

5.1.4 机器学习的分类

  • 有监督学习:有标记数据,e.g. Fisher,感知器算法,线性判别分析

  • 无监督学习:无标注数据,降维方法K-L

  • 半监督学习:无标注数据+有标注数据

  • 多任务学习:共享相关任务之间的表征

  • 迁移学习:训练数据与测试数据不是同分布的

  • 增强学习:间接的标注数据(状态和对应的reward )

  • 主动学习:主动选择训练数据

  • 自监督学习:从无标注数据提取监督信号

上一页附 第四章作业下一页5.2 统计机器学习

最后更新于1年前

这有帮助吗?