Python3,一篇搞定Numpy与Pandas的差异点及应用场景,妥妥的学到了。

举报
Carl_奕然 发表于 2023/07/06 09:54:24 2023/07/06
【摘要】 涨知识了, 没想到 Numpy和 Pandas的差异,这么多。

1、引言


小屌丝: 鱼哥,你说 Numpy 和Pandas都是应用于数据处理和分析,那这ta俩有啥区别呢?
小鱼:这… 名字不一样啊。

在这里插入图片描述
小屌丝:鱼哥,正经点。
小鱼:好吧, 那我就给你说几句。 本质上的区别。
小屌丝:别只说几句啊, 难得的机会,你多说几句,反正都是 Z公子买单。
小鱼:… 好吧,那就看在Z公子买单的份上,我就多说几句。

2、Numpy与Pandas比较


说到Numpy 和Pandas,在数据处理和分析界,无人不知无人不晓。
但是,嘿嘿, 为什么我还要叨唠呢?
因为今天,我们要聊一聊 Numpy和Pandas的另一面。

在这里插入图片描述
2.1 相同点


首先,Numpy 和Pandas的相同点,我们都知道,即:

  • Numpy和Pandas都是Python的第三方库,用于数据处理和分析。
  • 它们都提供了高效的数据结构和函数,可以处理大规模数据。
  • Numpy和Pandas都支持向量化操作,可以对整个数组或数据框进行快速计算。
  • 它们都具有广泛的功能和方法,可以进行数据的读取、转换、筛选、聚合等操作。


2.2 差异点


其次, Numpy 和Pandas的差异点,如:

应用不同

  • Numpy主要用于数值计算和科学计算,提供了多维数组对象(ndarray)和相关的数学函数;
  • 而Pandas则更适用于数据处理和分析,提供了数据框(DataFrame)和序列(Series)等数据结构;


数据结构不同

  • Numpy的数据结构是多维数组,适用于处理数值型数据;
  • 而Pandas的数据结构更灵活,可以处理不同类型的数据,包括数值型、字符串型、时间序列等;


操作不同

  • Numpy的操作更底层,更适合进行数值计算和数组操作;
  • 而Pandas提供了更高级的数据操作和分析功能,例如数据的合并、重塑、分组、透视等;


性能不同

  • Numpy的性能更高,适用于处理大规模的数值计算;
  • 而Pandas的性能相对较低,但更适合处理结构化的数据和进行数据分析。


2.3 应用场景


2.3.1 Numpy应用场景


Numpy应用场景如下:

  • 数值计算:numpy 提供了高效的数组运算方法,可以处理包含大量数字的数据集,比如矩阵运算、向量运算、数组加减乘除等等。
  • 科学计算:numpy 提供了大量的方法和函数,用于处理科学计算相关的数据,比如数据可视化、积分、微分、信号处理等等。
  • 机器学习:numpy 提供了大量的方法和函数,用于处理机器学习相关的数据,比如神经网络模型训练、自编码器、条件随机场等等。
  • 图像处理:numpy 提供了大量的方法和函数,用于处理图像相关的数据,比如图像滤波、图像变换、图像分割等等。
  • 科学数据分析:numpy 提供了大量的方法和函数,用于处理科学数据相关的数据,比如天文学、物理学、地球科学等等。

2.3.2 Pandas 应用场景


pandas 的应用场景如下:

  • 数据分析:pandas 提供了大量的方法和函数,用于处理数据的不同方面,比如数据读取、数据过滤、数据分组、数据排序、数据汇总、数据分析等等。
  • 金融分析:pandas 提供了大量的方法和函数,用于处理金融数据相关的数据,比如股票数据分析、债券数据分析、期货数据分析等等。
  • 商业智能:pandas 提供了大量的方法和函数,用于处理商业数据相关的数据,比如销售数据分析、客户数据分析、市场数据分析等等。
  • 数据可视化:pandas 提供了大量的方法和函数,用于处理数据可视化相关的数据,比如图表绘制、数据地图生成等等。
  • 人工智能:pandas 提供了大量的方法和函数,用于处理人工智能相关的数据,比如自然语言处理、图像识别、语音识别等等。

2.4 代码示例


接下来,我就以两段代码,来看下Pandas和Numpy的差异。

2.4.1 Numpy


代码示例

import numpy as np

# 创建一个一维数组
arr = np.array([1, 2, 3, 4, 5])

# 对数组进行加法操作
result = arr + 1

print(result)  # 输出:[2 3 4 5 6]




2.4.2 Pandas


代码示例

import pandas as pd

# 创建一个数据框
data = {'Name': ['Tom', 'John', 'Mike'],
        'Age': [25, 30, 35],
        'City': ['New York', 'London', 'Paris']}
df = pd.DataFrame(data)

# 筛选年龄大于30的数据
result = df[df['Age'] > 30]

print(result)


3、总结


看到这里,今天的分享就结束了。
今天主要对Numpy 和Pandas的差异点及应用场景进行了一些分享。
在上一篇,小鱼也说过, 学好Pandas,走到"哪里"都不怕。

如果您想学习数据分析,可以直接跳转到小鱼的数据分析专栏,

这里有:

  • 《数据分析之Pandas从入门到放弃:代码+实战,9分钟带你推开Pandas大门!!!》
  • 《Python3,Pandas 5行代码实现对excel 读写操作》
  • 《多种方法,同时执行多条SQL语句,并把查询结果分别写入不同Sheet页,妥妥的学到了》
  • 《Python3,处理Excel文件IO流的方法那么多,或许只有Pandas算得上靠谱。》


这里就不一样例举了, 感兴趣的,可以直接进入专栏,查看喜欢的文章。


我是小鱼:

  • CSDN 博客专家;
  • 阿里云 专家博主;
  • 51CTO博客专家;
  • 51认证讲师等;
  • 认证金牌面试官;
  • 职场面试及培训规划师;
  • 多个国内主流技术社区的认证专家博主;
  • 多款主流产品(阿里云等)测评一、二等奖获得者;


关注我,带你学习更多更专业更前言的Python技术。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。