《Python大规模机器学习》 —1.2.6科学计算发行版
1.2.6科学计算发行版
正如读者迄今为止所读到的,创建一个工作环境对于数据科学家来说是一个很耗时的操作。首先需要安装Python,然后逐个安装所需要的库。(有时安装过程可能不像你希望的那样顺利。)
如果想节省时间和精力并希望有一个能使用的完整Python运行环境,那么读者可下载、安装并使用科学Python发行版。除Python外,它还包含各种预装软件包,有时甚至还需要你设置其他工具和IDE设置。其中一些在数据科学家中很知名,在接下来的章节中,你将学习两个最有用和最实用软件包的主要特性。
若要立即开始学习本书内容,我们建议你首先下载并安装名为Anaconda(我们认为Anaconda是最完整的发行版)的科学发行版,在运行完本书示例后,可以决定完全卸载发行版并单独设置Python,这些示例附带了项目所需的软件包。
再次说明,如果可能的话,请下载并安装包含Python 3的版本。
建议使用软件包Anaconda(https://www.continuum.io/downloads),它是由Continuum Analytics提供的Python发行版,其中包括近200个软件包,包括NumPy、SciPy、pandas、IPython、matplotlib、Scikitlearn和StatsModels。它是一个跨平台发行版,可安装在其他已有Python发行版的计算机上,而且基本版本免费。包含高级功能的附加组件是单独收费的。Anaconda引入conda(二进制包管理器)命令行工具来管理软件包安装。如其网站所述,Anaconda的目标是为大规模处理、预测分析和科学计算提供企业级Python分发方式。对于Python版本2.7,推荐使用Anaconda发行版4.0.0。(https://docs.continuum.io/anaconda/pkgdocs上的列表能查看用Anaconda安装的软件包。)
第二个建议是,如果你正在Windows上工作,并且希望使用可移植发行版,则WinPython(http://winpython.sourceforge.net/)是一个非常有趣的替代品(抱歉,没有Linux和MacOS版本)。WinPython也是免费的,是一个由社区发行并维护的免费开源Python版。它由科学家精心设计,并包含许多基本的软件包,如NumPy、SciPy、matplotlib和IPython(与Anaconda基本相同)。它还将Spyder作为IDE,如果你有使用MATLAB语言和界面的经验,这会有所帮助。其关键优势在于具有便携性(可将其放在任何目录中,甚至放在U盘中),所以在计算机上可以有不同版本,还可以将其从一台Windows计算机移到另一台上,甚至只需替换目录就可用新版本替换旧版本。运行WinPython或它的shell程序时,将自动设置运行Python所需的所有环境变量,就像在你的系统上正常安装和注册Python一样。
撰写本书时,Python 2.7是最新发布版本,分发版本是2.7.10,2015年10月发布。此后,WinPython仅发布了Python 3版本的发行版更新。在用户系统上安装发行版之后,你可能需要更新本书中提供的示例所需的一些关键软件包。
- 点赞
- 收藏
- 关注作者
评论(0)