最强Python Pandas学习神器来了

举报
Python小二 发表于 2022/05/31 22:17:28 2022/05/31
【摘要】 来源:https://pandastutor.com/index.html Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。 sort_values (dogs[dogs['size'] == 'medium'] .sort...

来源:https://pandastutor.com/index.html

Pandas是数据挖掘常见的工具,掌握使用过程中的函数是非常重要的。本文将借助可视化的过程,讲解Pandas的各种操作。

sort_values


   
  1. (dogs[dogs['size'] == 'medium']
  2.  .sort_values('type')
  3.  .groupby('type').median()
  4. )

执行步骤:

  • size列筛选出部分行

  • 然后将行的类型进行转换

  • 按照type列进行分组,计算中位数

0383fbec0d4fad650811155de1d35d83.png

de9fbed49993956e09f705d7e38fe863.png

021936a81066231b28625f9be9d11cf4.png

106ee18bc9e8838007100c9d8816f86c.png

selecting a column

dogs['longevity']
  

88a3e22b76487239a649dab535624652.png

groupby + mean

dogs.groupby('size').mean()
  

执行步骤:

  • 将数据按照size进行分组

  • 在分组内进行聚合操作

36a542ce587f7ddd72f42de31decc691.png

3c3b0b8a76c91ce40d2d9740f6668e00.png

grouping multiple columns

dogs.groupby(['type''size'])
  

63c6cab27a24361c2d32cb06707ee793.png

groupby + multi aggregation


   
  1. (dogs
  2.   .sort_values('size')
  3.   .groupby('size')['height']
  4.   .agg(['sum''mean''std'])
  5. )

执行步骤

  • 按照size列对数据进行排序

  • 按照size进行分组

  • 对分组内的height进行计算

800218ddcca1be22fe6418772f99721d.png

d4598a79bb5689f1ac4c6534799f6a3a.png

3fa935e749fae21a598d1bc8f3e1db57.png

67d3557a47d9574b2936679491108d6c.png

filtering for columns

df.loc[:, df.loc['two'] <= 20]
  

82a3bed5051c43d1a009f420d0410a87.png

filtering for rows

dogs.loc[(dogs['size'] == 'medium') & (dogs['longevity'] > 12), 'breed']
  

c259384727e36daf9880f7ab66a6f89f.png

dropping columns

dogs.drop(columns=['type'])
  

bea19db9d448572f882ae7deb4154c51.png

joining

ppl.join(dogs)
  

0467fc17c94c8c7cfd51cd88dbca3395.png

merging

ppl.merge(dogs, left_on='likes', right_on='breed', how='left')
  

2f5be4c025c8cc70ae35c9fc1ffb2154.png

pivot table

dogs.pivot_table(index='size', columns='kids', values='price')
  

5ece847faf965803abcc6c022a36240d.png

melting

dogs.melt()
  

efaab2c2277acdd4ccb1724710165839.png

pivoting

dogs.pivot(index='size', columns='kids')
  

fd67990235e84dfb805e099adee0099d.png

stacking column index

dogs.stack()
  

0e9e1629d90d0b581a1333ca8d2affc4.png

unstacking row index

dogs.unstack()
  

fa79300730ea2bca008664c396d42386.png

resetting index

dogs.reset_index()
  

f5f1e115f69da340d3ffacbd2a31bdb6.png

setting index

dogs.set_index('breed')
  

e52c1aa1b85bff7157540fb26d4bb61e.png


   
  1. 推荐阅读  点击标题可跳转
  2. Python学习手册
  3. Pandas学习大礼包
  4. 100+Python爬虫项目
  5. Python数据分析入门手册
  6. 浙江大学内部Python教程
  7. 240个Python练习案例附源码
  8. 70个Python经典实用练手项目
  9. 整理了30款Python小游戏附源码

文章来源: ityard.blog.csdn.net,作者:Python小二,版权归原作者所有,如需转载,请联系作者。

原文链接:ityard.blog.csdn.net/article/details/125057342

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。