《scikit-learn机器学习常用算法原理及编程实战》—2 Python机器学习软件包
第2章 Python机器学习软件包
本章介绍了scikit-learn相关开发环境的搭建步骤,以及IPython、Numpy和Pandas、Matplotlib等软件包的基础知识,最后通过一个scikit-learn机器学习实例,介绍了scikit- learn的一般性原理和通用规则。本章涵盖的主要内容如下:
* 搭建Python机器学习编程环境;
* 熟悉IPython交互式编程环境;
* 熟悉Numpy包的基础操作;
* 熟悉Pandas包的基础操作;
* 熟悉Matplotlib及常用的画图操作;
* 熟悉scikit-learn软件包,并完成一个手写识别机器学习程序。
2.1 开发环境搭建
若读者没有安装过Python,一个最简单的方式是直接安装Python针对科学计算而发布的开发环境Anaconda。访问www.continuum.io/downloads网站,根据你所使用的操作系统下载合适的版本直接安装即可。Anaconda里包含了本书要求的所有工具包,包括IPython、Numpy、scipy、Matplotlib和scikit-learn等,针对主流的操作系统Windows/Linux/ Mac都提供了相应的安装包。
若读者已经安装了Python或者觉得Anaconda安装包太大了,只想安装需要的工具包,则可以逐个安装这些工具包。这里假设已经安装了Python和pip。那么可以通过pip命令来安装所需要的工具包:
pip install jupyter numpy matplotlib scipy scikit-learn seaborn
若读者没有安装pip,可以参阅pip官方网站pip.pypa.io/en/stable/installing,具体步骤是下载get-pip.py文件,然后用python命令执行这个文件即可完成pip的安装。
安装完成后,可以在终端输入ipython命令启动IPython,并在IPython环境检查我们所需要的工具包的版本号。这里安装的工具包及其版本号如下:
$ ipython
Python 2.7.10 (default, Jul 30 2016, 19:40:32)
Type "copyright", "credits" or "license" for more information.
IPython 5.3.0 -- An enhanced Interactive Python.
? -> Introduction and overview of IPython's features.
%quickref -> Quick reference.
help -> Python's own help system.
object? -> Details about 'object', use 'object??' for extra details.
In [1]: import numpy
In [2]: import matplotlib
In [3]: import sklearn
In [4]: numpy.__version__
Out[4]: '1.12.0'
In [5]: matplotlib.__version__
Out[5]: '2.0.0'
In [6]: sklearn.__version__
Out[6]: '0.18.1'
* Python:2.7.10;
* Ipython:5.3.0;
* Numpy:1.12.0;
* Matplotlib:2.0.0;
* Sklearn:0.18.1。
本书所有的示例程序均在上面的环境中测试通过。如果读者要安装和本书编写时一样的编程环境,可以下载随书代码,找到代码主目录,并在主目录下执行pip install -r requirements.txt命令即可。
- 点赞
- 收藏
- 关注作者
评论(0)