《机器学习:算法视角(原书第2版)》 —1.3 机器学习的类别

举报
华章计算机 发表于 2019/12/21 11:32:30 2019/12/21
【摘要】 本节书摘来自华章计算机《机器学习:算法视角(原书第2版)》 一书中第1章,第1.3节,作者是[新西兰] 史蒂芬·马斯兰(Stephen Marsland),高 阳 商 琳 等译。

1.3 机器学习的类别

在本章开始的网站例子中,我们的目标是根据收集的信息,对网站的访客可能购买哪种软件做出预测。这里有几件有趣的事情。首先是数据,知道访客之前购买过的软件以及访客的年龄可能会有用。然而,这些信息不可能从他们的浏览器中得到(即使是cookie,也不能告诉你某个人的年龄),因此无法使用这些信息。挑选你想要使用的变量(专业术语称为特征(feature))对于找到问题合适的解来说,是很重要的一部分,这一点将在本书的几个地方都有所讨论。同样,选择如何处理数据也是很重要的。这在例子中时间的获取上有所体现。你的计算机可以记录精确到毫秒的时间,但这样做毫无意义,因为你想要做的是发现用户之间相似的模式。基于这个原因,在前面的这个例子中,我选择把时间量化为四个范围——上午、下午、晚上、夜间,显然我需要确保这些时间对于其所在时区来讲是正确的。

我们把学习不精确地定义为通过训练从而在某项工作上做得更好。这导致了几个很重要的问题:计算机如何知道它是否表现得更好,抑或是更差,以及它如何知道怎样才能有所提高?对于这些问题,有几个不同的但都是合理的答案,而且基于此产生了不同类型的机器学习。我们可以把某个问题的正确答案提供给算法,这样下一次算法遇到同样问题的时候就可以得到正确的结果(这就是在网站例子中发生的,因为我们知道这位用户已经购买了什么软件)。但是,我们希望只提供给算法部分正确的答案,然后它能够自动地发现问题所有的正确答案(泛化)。或者,我们所能做的是告知算法某一个答案是否正确,但并不告知如何去寻找正确的答案,这样它必须对正确的答案进行搜索(search)。这里的一个变化是我们根据某个答案的正确程度给它一个得分,而不是只响应一个“正确或是错误”。最后一种情况,我们可能根本没有正确的答案,只能设法让算法去寻找具有相似性的输入。

上面针对这个问题的不同回答,给我们将要讨论的机器学习类别提供了一个好的分类方法:

●监督学习(supervised learning):提供了一个由包含正确回答(目标(target))的样本组成的训练集(training set),并且以这个训练集为基础,算法进行泛化,直到对所有可能的输入都给出正确的回答。这也称为从范例(exemplar)中学习。

●无监督学习(unsupervised learning):没有提供正确的回答,取而代之的是算法试图鉴别出输入之间的相似之处,从而使有着共同点的输入被归类为(categorized)同一类。非监督学习的统计学方法称为密度估计(density estimation)。

●强化学习(reinforcement learning):强化学习介于监督学习和非监督学习之间。当答案不正确时,算法会被告知,但如何去改正则不得而知。它需要去探索,试验不同的可能情况,直到得到正确的答案。强化学习有时被称为伴随评论家(critic)的学习,因为它只对答案评分,而不提出改进的建议。

●进化学习(evolutionary learning):可以将生物学的进化看成一个学习的过程,即生物有机体改变自身,以提高在所处环境下的存活率和拥有后代的概率。我们将研究如何在计算机中对这一过程建模。在此使用适应度(fitness)的概念,相当于是对当前解答方案好坏程度的评分。

最常见的一类学习是监督学习,并且这将是下面几章的中心。因此,在开始之前,先来看一下什么是监督学习,以及它能够解决什么样的问题。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。