1 机器学习组件

机器学习是人工智能的一个分支,机器学习主要由图所示的组件构成,即:数据、模型、目标函数、算法。

图1 机器学习组件

数据: 数据集由一个个独立的样本组成,样本(数据点/数据实例)由一组称为特征的属性构成,监督学习还会包含标签。

模型: 对数据的处理,根据输入的数据给出相应的结果。模型存在一些列参数,参数可以影响模型的效果。

目标函数: 用来量化模型的有效性。

算法: 调整模型参数以优化模型的效果。

2 机器学习分类

2.1 监督学习

监督学习(supervised learning)擅长在“给定输入特征”的情况下预测标签。训练时需要提供一个聚到的训练样本集,每个样本包含特征和相应标签值。

监督学习包含如下几类问题:

  • 回归:根据特征评估标签值(e.g. 价格)。
  • 分类:预测样本属于属于哪个分类。
  • 标记:预测样本包含多个不互相排斥的分类。
  • 搜索:对搜索结果进行排序。
  • 推荐:个性化推荐。
  • 序列学习:样本之间存在前后联系(翻译)。

2.2 无监督学习

无监督学习的训练样本集不提供标签。主要处理如下的问题:

  • 聚类:对数据进行分类。
  • 主成分分析:用少量参数来描述数据的线性属性(运动轨迹:速度、方向、加速度)。
  • 因果关系:影响数据的根本原因。
  • 生成对抗性网络:合成数据。

2.3 强化学习

监督学习与非监督学习都是一种离线学习,首先从环境中收集足够的样本进行训练,然后在环境中使用,训练好的模型不再受环境影响。

强化学习则是与环境进行交互,其过程可以描述如下:在每个特定时间点,智能体从环境 接收一些观察,并且必须选择一个动作,然后通过某种机制将 其传输回环境,最后智能体从环境中获得奖励。

图2 强化学习与环境的交互

3 深度学习

深度学习是一种解决机器学习问题的一种工具,其依赖于数据与神经网络编程。深度是指其使用了多层模型。

参考文献

[1] 《动手学深度学习》 — 动手学深度学习 2.0.0 documentation[EB/OL]. [2024-12-21]. https://zh.d2l.ai/.