【Datawhale8月打卡】吃瓜教程Task1笔记
第一章:
通过 学习1 .2 了解了机器学习的基本术语,从数据中学得模型的过程称为“学习”或“训练”,这个过程通过执行 某个学习 算法来完成。模型可以看作学习算法在给定数据和参数空间上的实例化。
在计算机系统中,“经验”通常以“数据”的形式存在,因此,机器学习所研究的主要内容,是在计算机上从数据中产生“模型( model)”的算法,即“学习算法”(learning algorithm)。
通过学习算法,我们将经验数据提供给它,它就能基于这些数据产生模型。此过程我们通常称为训练(train)
在面对新的情况时,模型会给我们提供相应的判断。此过程我们通常称为测试(test)或推理(infer)
1.2.三要素
1. 模型 :基于问题,假设某个函数的集合,又称为假设空间(输入空间到输出空间所有映射的集合)
2. 策略 :根据应用 某个评价 指标来求解最优模型,通常通过优化一个损失函数
3. 算法 :即学习模型的具体计算方法,即求解最优化问题的算法
1.3 实现步骤
实现机器学习方法的步骤可以简略如下:
1. 得到一个有限的训练数据集合
2. 确定包含所有可能得模型的假设空间,即学习模型的集合
3. 确定模型选择的准则,即学习策略
4. 实现求解最优模型的算法,即学习算法
5. 通过学习方法选择最优模型
6. 利用学习的最优模型对新数据进行预测或分析
2.3.2 布尔概念学习
布尔概念学习是概念学习中最基本的一种。即对 “ 是 ” 、 “ 不是 ” 进行学习。
2.3.3 归纳偏好(inductive bias)
若算法更偏好于“尽可能特殊、具体”的模型,则会选择图3中的
( 色 泽 = ∗ ; 根 蒂 = 蜷 缩 ; 敲 声 = 浊 响 ) (色泽 = *;根蒂 = 蜷缩;敲声 =浊响)
(色泽 = ∗ ;根蒂=蜷缩;敲声=浊响)
若算法更偏好于“尽可能一般”的模型,则会选择图 3中的
( 色 泽 = ∗ ; 根 蒂 = 蜷 缩 ; 敲 声 = ∗ ) 或 ( 色 泽 = ∗ ; 根 蒂 = ∗ ; 敲 声 = 浊 响 ) (色泽 = *;根蒂 = 蜷缩;敲声 =*)或(色泽 = *;根蒂 = *;敲声 =浊响)
(色泽 = ∗ ;根蒂=蜷缩;敲声= ∗ )或(色泽= ∗ ;根蒂= ∗ ;敲声=浊响)
- 点赞
- 收藏
- 关注作者
评论(0)