《Python大规模机器学习》 —1.2.6科学计算发行版

举报
华章计算机 发表于 2020/02/14 19:37:45 2020/02/14
【摘要】 本节书摘来自华章计算机《Python大规模机器学习》 一书中第1章,第1.2.6节,作者是[荷]巴斯蒂安·贾丁(Bastiaan Sjardin)[意]卢卡·马萨罗(Luca Massaron)[意]阿尔贝托·博斯凯蒂(Alberto Boschetti),王贵财 刘春明 译。

1.2.6科学计算发行版

正如读者迄今为止所读到的,创建一个工作环境对于数据科学家来说是一个很耗时的操作。首先需要安装Python,然后逐个安装所需要的库。(有时安装过程可能不像你希望的那样顺利。)

如果想节省时间和精力并希望有一个能使用的完整Python运行环境,那么读者可下载、安装并使用科学Python发行版。除Python外,它还包含各种预装软件包,有时甚至还需要你设置其他工具和IDE设置。其中一些在数据科学家中很知名,在接下来的章节中,你将学习两个最有用和最实用软件包的主要特性。

若要立即开始学习本书内容,我们建议你首先下载并安装名为Anaconda(我们认为Anaconda是最完整的发行版)的科学发行版,在运行完本书示例后,可以决定完全卸载发行版并单独设置Python,这些示例附带了项目所需的软件包。

再次说明,如果可能的话,请下载并安装包含Python 3的版本。

建议使用软件包Anaconda(https://www.continuum.io/downloads),它是由Continuum Analytics提供的Python发行版,其中包括近200个软件包,包括NumPy、SciPy、pandas、IPython、matplotlib、Scikitlearn和StatsModels。它是一个跨平台发行版,可安装在其他已有Python发行版的计算机上,而且基本版本免费。包含高级功能的附加组件是单独收费的。Anaconda引入conda(二进制包管理器)命令行工具来管理软件包安装。如其网站所述,Anaconda的目标是为大规模处理、预测分析和科学计算提供企业级Python分发方式。对于Python版本2.7,推荐使用Anaconda发行版4.0.0。(https://docs.continuum.io/anaconda/pkgdocs上的列表能查看用Anaconda安装的软件包。)

第二个建议是,如果你正在Windows上工作,并且希望使用可移植发行版,则WinPython(http://winpython.sourceforge.net/)是一个非常有趣的替代品(抱歉,没有Linux和MacOS版本)。WinPython也是免费的,是一个由社区发行并维护的免费开源Python版。它由科学家精心设计,并包含许多基本的软件包,如NumPy、SciPy、matplotlib和IPython(与Anaconda基本相同)。它还将Spyder作为IDE,如果你有使用MATLAB语言和界面的经验,这会有所帮助。其关键优势在于具有便携性(可将其放在任何目录中,甚至放在U盘中),所以在计算机上可以有不同版本,还可以将其从一台Windows计算机移到另一台上,甚至只需替换目录就可用新版本替换旧版本。运行WinPython或它的shell程序时,将自动设置运行Python所需的所有环境变量,就像在你的系统上正常安装和注册Python一样。

撰写本书时,Python 2.7是最新发布版本,分发版本是2.7.10,2015年10月发布。此后,WinPython仅发布了Python 3版本的发行版更新。在用户系统上安装发行版之后,你可能需要更新本书中提供的示例所需的一些关键软件包。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。