Python 数据分析及预处理常用库

举报
冰峰 发表于 2025/03/31 10:33:34 2025/03/31
【摘要】 Python自身数据分析功能有限,需借助第三方库增强。常用库包括NumPy、pandas、Matplotlib等。NumPy由Numeric发展而来,提供了多维数组对象及各种API,支持高效的数据处理,如数学、逻辑运算等,常作为其他高级库如pandas和Matplotlib的依赖库。其内置函数处理速度极快,建议优先使用以提升程序效率。

Python本身的数据分析功能不强,需要安装一些第三方扩展库以增强器能力。数据分析及预处理常用库有NumPy、pandas、Matplotlib等,如表2-4所示。
表2-4 Python数据分析及预处理常用库
image.png

2.2.1 NumPy
NumPy的前身Numeric最早是由吉姆 弗贾宁与其他协作者共同开发的。2005年,特拉维斯 奥利芬在Numeric中结合力另一个同性质的程序库Numarray的特色,并加入了其他扩展,开发出了NumPy。
NumPy是用Python进行科学计算的基础软件包,也是一个Python库,提供多维数组对象和各种派生对象(如掩码数组和矩阵),以及用于数组快速操作的各种API,包括数学、逻辑、形状操作、排序、选择、输入/输出、离散傅立叶变换、基本线性代数、基本统计运算和随机模拟等,因而能够快速地处理数据量大且繁琐的数据运算。
NumPy还是很多更高级的扩展库的依赖库,后面介绍的pandas、Matplotlib、SciPy等库都依赖于NumPy。值得强调的是,NumPy中的内置函数处理数据的速度是C语言级别的,非常快,因此在编写程序的时候,应当尽量使用这些内置函数,从而避免效率瓶颈的现象。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。