《Python数据挖掘与机器学习实战》—1 机器学习基础
第1章 机器学习基础
人工智能(Artificial Intelligence,AI)是智能机器,如计算机所执行的与人类智能有关的功能,如识别、判断、证明、学习和问题求解等思维活动。这反映了人工智能学科的基本思想和内容,即人工智能是研究人类智能活动规律的一门学科。1956年在Dartmouth学会上首次提出了“人工智能”这一概念,而人工智能开始迅速发展是在计算机出现后,因为人们真正有了可以模拟人类思维的工具。现如今,人工智能已经不再是一个小众化的研究课题了,全世界几乎所有的理工科类大学都在研究这门学科,甚至为此设立了专门的研究机构。越来越多的学习计算机、自动化控制和软件工程专业的本科生或研究生,将人工智能作为自己的研究方向。在科学家的不懈努力下,如今的计算机与原来相比已经变得十分“聪明”了,某些时候计算机已经可以完成原来只属于人类的工作,并且其高速性和准确性是人类远不可及的。
机器学习(Machine Learning,ML)是人工智能研究领域中最重要的分支之一。它是一门涉及多领域的交叉学科,其包含高等数学、统计学、概率论、凸分析和逼近论等多门学科。该学科专门研究计算机应如何模拟并实现人类的学习行为,以获取人类所不了解的新知识,并使计算机能够使用已有的知识或经验,不断改善自身的性能以得到更加精确的知识。它是人工智能的核心,是使计算机具有智能的根本途径。其应用遍及人工智能的各个领域。它主要使用归纳、综合而不是演绎。
数据挖掘(Data Mining)是从海量数据中获取有效的、新颖的、潜在有用的、最终可理解模式的非平凡过程。数据挖掘中用到了大量的机器学习界所提供的数据分析技术和数据库界所提供的数据管理技术。从数据分析的角度来看,数据挖掘与机器学习有很多相似之处,但不同之处也十分明显。例如,数据挖掘并没有机器学习探索人的学习机制这一科学发现任务,数据挖掘中的数据分析是针对海量数据进行的。从某种意义上说,机器学习的科学成分更重一些,而数据挖掘的技术成分更重一些。数据挖掘中用到了大量的机器学习界所提供的数据分析技术和数据库界所提供的数据管理技术。简单地说,机器学习和数据库是数据挖掘的基石。
本章要点:
机器学习概述;
机器学习的发展历程;
机器学习分类及其应用;
Python语言的优势;
Python常用开发工具。
1.1 机器学习概述
机器学习,通俗地讲就是让机器来实现学习的过程,让机器拥有学习的能力,从而改善系统自身的性能。对于机器而言,这里的“学习”指的是从数据中学习,从数据中产生“模型”的算法,即“学习算法”。有了学习算法,只要把经验数据提供给它,它就能够基于这些数据产生模型,在面对新的情况时,模型能够提供相应的判断,进行预测,如图1-1所示。机器学习实质是基于数据集的,通过对数据集的研究,找出数据集中数据之间的联系和数据的真实含义。
图1-1 什么是机器学习
- 点赞
- 收藏
- 关注作者
评论(0)