3-Groupby分组统计--数据分析

举报
brucexiaogui 发表于 2021/12/30 00:25:20 2021/12/30
【摘要】 3-Groupby分组统计 In [2]: ...

3-Groupby分组统计

In [2]:
import pandas as pd
df = pd.DataFrame({'Key':['A','B','C','A','B','C','A','B','C'],
                  'data':[0,5,10,5,10,15,10,15,20]})
df
Out[2]:
  Key data
0 A 0
1 B 5
2 C 10
3 A 5
4 B 10
5 C 15
6 A 10
7 B 15
8 C 20

groupby() 分组:根据key字段进行分组,对ABC分别进行求和运算

In [6]:
df.groupby('Key').sum()
Out[6]:
  data
Key  
A 15
B 30
C 45

numpy类型使用groupby

In [7]:
 
          
import numpy as np
df.groupby('Key').aggregate(np.sum)
Out[7]:
  data
Key  
A 15
B 30
C 45

根据Sex进行分组,分别计算Age平均值

In [8]:
df = pd.read_csv('C:/JupyterWork/data/titanic.csv')
In [10]:
df.groupby('Sex')['Age'].mean()
Out[10]:
Sex
female    27.915709
male      30.726645
Name: Age, dtype: float64
In [11]:
 
          
df.groupby('Sex')['Survived'].mean()
Out[11]:
Sex
female    0.742038
male      0.188908
Name: Survived, dtype: float64
In [ ]:

文章来源: brucelong.blog.csdn.net,作者:Bruce小鬼,版权归原作者所有,如需转载,请联系作者。

原文链接:brucelong.blog.csdn.net/article/details/80719283

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。