- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《机器学习：算法视角（原书第2版）》 —1.3　机器学习的类别

华章计算机发表于 2019/12/21 11:32:30 2019/12/21

【摘要】本节书摘来自华章计算机《机器学习：算法视角（原书第2版）》一书中第1章，第1.3节，作者是[新西兰]　史蒂芬·马斯兰（Stephen Marsland），高　阳　商　琳　等译。

1.3　机器学习的类别

在本章开始的网站例子中，我们的目标是根据收集的信息，对网站的访客可能购买哪种软件做出预测。这里有几件有趣的事情。首先是数据，知道访客之前购买过的软件以及访客的年龄可能会有用。然而，这些信息不可能从他们的浏览器中得到（即使是cookie，也不能告诉你某个人的年龄），因此无法使用这些信息。挑选你想要使用的变量（专业术语称为特征（feature））对于找到问题合适的解来说，是很重要的一部分，这一点将在本书的几个地方都有所讨论。同样，选择如何处理数据也是很重要的。这在例子中时间的获取上有所体现。你的计算机可以记录精确到毫秒的时间，但这样做毫无意义，因为你想要做的是发现用户之间相似的模式。基于这个原因，在前面的这个例子中，我选择把时间量化为四个范围——上午、下午、晚上、夜间，显然我需要确保这些时间对于其所在时区来讲是正确的。

我们把学习不精确地定义为通过训练从而在某项工作上做得更好。这导致了几个很重要的问题：计算机如何知道它是否表现得更好，抑或是更差，以及它如何知道怎样才能有所提高？对于这些问题，有几个不同的但都是合理的答案，而且基于此产生了不同类型的机器学习。我们可以把某个问题的正确答案提供给算法，这样下一次算法遇到同样问题的时候就可以得到正确的结果（这就是在网站例子中发生的，因为我们知道这位用户已经购买了什么软件）。但是，我们希望只提供给算法部分正确的答案，然后它能够自动地发现问题所有的正确答案（泛化）。或者，我们所能做的是告知算法某一个答案是否正确，但并不告知如何去寻找正确的答案，这样它必须对正确的答案进行搜索（search）。这里的一个变化是我们根据某个答案的正确程度给它一个得分，而不是只响应一个“正确或是错误”。最后一种情况，我们可能根本没有正确的答案，只能设法让算法去寻找具有相似性的输入。

上面针对这个问题的不同回答，给我们将要讨论的机器学习类别提供了一个好的分类方法：

●监督学习（supervised learning）：提供了一个由包含正确回答（目标（target））的样本组成的训练集（training set），并且以这个训练集为基础，算法进行泛化，直到对所有可能的输入都给出正确的回答。这也称为从范例（exemplar）中学习。

●无监督学习（unsupervised learning）：没有提供正确的回答，取而代之的是算法试图鉴别出输入之间的相似之处，从而使有着共同点的输入被归类为（categorized）同一类。非监督学习的统计学方法称为密度估计（density estimation）。

●强化学习（reinforcement learning）：强化学习介于监督学习和非监督学习之间。当答案不正确时，算法会被告知，但如何去改正则不得而知。它需要去探索，试验不同的可能情况，直到得到正确的答案。强化学习有时被称为伴随评论家（critic）的学习，因为它只对答案评分，而不提出改进的建议。

●进化学习（evolutionary learning）：可以将生物学的进化看成一个学习的过程，即生物有机体改变自身，以提高在所处环境下的存活率和拥有后代的概率。我们将研究如何在计算机中对这一过程建模。在此使用适应度（fitness）的概念，相当于是对当前解答方案好坏程度的评分。

最常见的一类学习是监督学习，并且这将是下面几章的中心。因此，在开始之前，先来看一下什么是监督学习，以及它能够解决什么样的问题。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《机器学习：算法视角（原书第2版）》 —1.3　机器学习的类别

1.3　机器学习的类别

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《机器学习：算法视角（原书第2版）》 —1.3 机器学习的类别

1.3 机器学习的类别

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《机器学习：算法视角（原书第2版）》 —1.3　机器学习的类别

1.3　机器学习的类别