# 5.1 机器学习简介

> 桑克（R. Shank）
>
> “一台计算机若不会学习，就不能说它具有智能。”

## 5.1.1 统计机器学习

* 机器学习
  * 更强调面向算法
  * 机器学习强调算法的结果要好，所以机器学习很关注损失函数
* 统计学
  * 更偏重于面向模型
  * 统计学要先扔出来一大堆模型假设，然后站在模型上面通 过严格的数学推导做出结果

{% hint style="success" %} <mark style="color:orange;">**统计机器学习**</mark>：是基于数据构建概率统计模型并运用模型对数据进行预测分析的一门学科
{% endhint %}

## 5.1.2 机器学习三要素

{% hint style="success" %}
"A computer program is said to learn from <mark style="color:red;">**experience E**</mark> with respect to some class of <mark style="color:red;">**tasks T**</mark> and <mark style="color:red;">**performance measure P**</mark>, if its performance at tasks in T, as measured by P, improves with experience E"

\--Tom M. Mitchell
{% endhint %}

* <mark style="color:orange;">**经验（E）**</mark>：训练数据
* <mark style="color:orange;">**模型（T）**</mark>：—需要学习的目标函数
* 学习算法: 怎么样从经验中推断出模型
* <mark style="color:orange;">**评价（P）**</mark>：测试数据

{% hint style="success" %}
机器学习的任务：Improve on task（T）, with respect to performance metric（P）, based on experience（E）
{% endhint %}

## 5.1.3 机器学习的特点

* <mark style="color:purple;">**数据**</mark>大量、廉价；<mark style="color:purple;">**知识**</mark>昂贵、稀少
* 数据产生过程的细节是未知的，但是数据产生的过程不是完全随机的
* 通过利用数据中的某些模式或规律从数据中<mark style="color:orange;">**学习模型**</mark>：反推数据生成路径
* 模型通常不是完整过程的精确复制品，而是一种良好且有用的<mark style="color:orange;">**近似**</mark>：（George Box: “All models are wrong, but some are useful.”)
* 模型可以<mark style="color:orange;">**描述**</mark>从数据中获取知识，或<mark style="color:orange;">**预测将来**</mark>（具有预测性），或者两者兼而有之
* 几乎所有的科学都关注于<mark style="color:orange;">**用模型拟合数据**</mark>：推理

## 5.1.4 机器学习的分类

* <mark style="color:red;">**有监督学习**</mark>：有标记数据，e.g. Fisher，感知器算法，线性判别分析
* <mark style="color:red;">**无监督学习**</mark>：无标注数据，降维方法K-L
* <mark style="color:red;">**半监督学习**</mark>：无标注数据+有标注数据
* <mark style="color:blue;">**多任务学习**</mark>：共享相关任务之间的表征
* <mark style="color:blue;">**迁移学习**</mark>：训练数据与测试数据不是同分布的
* <mark style="color:blue;">**增强学习**</mark>：间接的标注数据（状态和对应的reward ）
* <mark style="color:blue;">**主动学习**</mark>：主动选择训练数据
* <mark style="color:blue;">**自监督学习**</mark>：从无标注数据提取监督信号


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://aye10032.gitbook.io/prml-note/di-wu-zhang-tong-ji-ji-qi-xue-xi/5.1-ji-qi-xue-xi-jian-jie.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
