《数据科学与分析:Python语言实现》 —2.7 总结
【摘要】 本节书摘来自华章计算机《数据科学与分析:Python语言实现》 一书中第2章,第2.7节,作者是[英]赫苏斯·罗格尔–萨拉查(Jesús Rogel-Salazar),白 皓 刘江一 上官明乔 刁 娟 译。
2.7 总结
在本章中,我们介绍了使用Python编程的一些最重要的方面。首先是在数据科学和分析工作流程中使用Python的一些优点,以及Python程序员使用的一些通用Pythonista编程风格。
我们已经看到Python如何在诸如iPython之类的Shell中以交互方式用作脚本语言,还可以在iPython / Jupyter Notebook的帮助下使用丰富的生态系统,也介绍了语言支持的不同类型:数字、字符串、复数、列表、元组、字典。同样,我们看到Python如何处理可变和不可变对象。
我们可以在控制流结构的帮助下指导程序执行指令的方式。此外,Python还通过许多可以轻松导入和使用的模块和包(类库)扩展其功能。在本章中,我们介绍了一些模块,如NumPy和SciPy。在功能强大的Pandas库的帮助下,我们可以非常直接的方式进行数据分析和操作。
最后,Matplotlib是一个模块,它使我们能够创建绘图并可视化,作为我们进行分析的一部分。这些并不是Python程序员可用的唯一有用的模块,但它们是本书其余部分将使用的一些模块。如果需要使用我们未在此处介绍的其他模块,相应的章节中会有明确说明。
在下一章中,我们将介绍机器学习和模式识别的重要概念,这些概念是我们进行数据科学和分析运作的基础,并且我们将展示另一个有用的Python库:Scikit-learn。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)