《scikit-learn机器学习常用算法原理及编程实战》—1 机器学习介绍
第1章 机器学习介绍
本章简要介绍了机器学习的定义、应用场景及机器学习的分类,并通过一个简单的示例介绍了机器学习的典型步骤,以及机器学习领域的一些专业术语。本章涵盖的内容如下:
机器学习的概念;
机器学习要解决的问题分类;
使用机器学习解决问题的一般性步骤。
1.1 什么是机器学习
机器学习是近年来的一大热门话题,然而其历史要倒推到半个多世纪之前。1959年Arthur Samuel给机器学习的定义是:
Field of study that gives computers the ability to learn without being explicitly programmed
即让计算机在没有被显式编程的情况下,具备自我学习的能力。
Tom M. Mitchell 在操作层面给出了更直观的定义:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
翻译过来用大白话来说就是:针对某件事情,计算机会从经验中学习,并且越做越好。从机器学习领域的先驱和“大牛”们的定义来看,我们可以自己总结出对机器学习的理解:机器学习是一个计算机程序,针对某个特定的任务,从经验中学习,并且越做越好。
从这个理解上,我们可以得出以下针对机器学习最重要的内容。
数据:经验最终要转换为计算机能理解的数据,这样计算机才能从经验中学习。谁掌握的数据量大、质量高,谁就占据了机器学习和人工智能领域最有利的资本。用人类来类比,数据就像我们的教育环境,一个人要变得聪明,一个很重要的方面是能享受到优质的教育。所以,从这个意义来讲,就能理解类似 Google 这种互联网公司开发出来的机器学习程序性能为什么那么好了,因为他们能获取到海量的数据。
模型:即算法,是本书要介绍的主要内容。有了数据之后,可以设计一个模型,让数据作为输入来训练这个模型。经过训练的模型,最终就成了机器学习的核心,使得模型成为了能产生决策的中枢。一个经过良好训练的模型,当输入一个新事件时,会做出适当的反应,产生优质的输出。
- 点赞
- 收藏
- 关注作者
评论(0)