Pandas库函数笔记
Pandas 可以读取CSV、JSON、Text等格式文件
pandas两个核心数据结构是:
一维的Series——带有标签的同构类型数组
二维的DataFrame——二维的表结构
read_csv to_csv read_json to_json
data2=pd.DataFrame(data,index=[‘A’,‘B’,‘C’],columns=[‘a’,‘b’,‘c’])
其中:index行名 columns列名
df.shape查看数据维度 df.shape[0]返回行数,df.shape[1]返回列数
df.head() 默认返回DataFrame数据的前5行,查看更多可传参进去
df.tail() 默认返回DataFrame数据的后5行,查看更多可传参进去
df.describe() 查看数据的汇总统计
df.info() 查看数据概况
df.iloc[] 使用索引的相对位置来选取数据
df.loc[‘行名’] 使用行索引来选取整行数据
df.列名/df[‘列名’] 查看某列数据
df.concat() 直接放到数组中进行拼接,按行拼接,数据在行的方向上增加
df.merge() 按列拼接,
df.append() 增加某列数据
df.isnull() 检查数据是否为空值
df.isnull().num() 空值统计
df.fillna(n) 以n替换空值
df.dropna() 删除包含空值的行和列,默认删除包含空值的行
df.dropna(axis=1) 删除包含空值的列
df[‘列名’].astype() 对指定列进行数据类型转换
df.columns.value_counts() 统计唯一值的个数,按列返回统计结果
df.sort_values(by=’列名’,ascending=True) 按列值大小升序排列
- 点赞
- 收藏
- 关注作者
评论(0)