- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

DataFrame必会基础操作

Python新视野发表于 2022/04/28 18:34:29 2022/04/28

【摘要】 DataFrame创建创建空的 DataFrame创建一个空的 , 包含三行空数据。df = pd.DataFrame(columns=['name', 'age'], index=[0, 1, 2]) 常规 DataFrame 创建方式这里只介绍常见的三种，数组创建、字典创建、外部文件创建。常见文件读取的时候直接指定文件路径即可，对于 xlsx 文件可能存在多个 sheet 这时就需要...

DataFrame创建

创建空的 DataFrame

创建一个空的 , 包含三行空数据。

df = pd.DataFrame(columns=['name', 'age'], index=[0, 1, 2])

常规 DataFrame 创建方式

这里只介绍常见的三种，数组创建、字典创建、外部文件创建。常见文件读取的时候直接指定文件路径即可，对于 xlsx 文件可能存在多个 sheet 这时就需要指定 sheet_name 。

# 数组创建
df = pd.DataFrame(data=[['路飞', 18],
                       ['索隆', 19],
                       ['娜美', 18]],
                  columns=['name', 'age'])
# 通过字典创建
df = pd.DataFrame({'name': ['路飞','索隆', '娜美'],
					 'age':[18, 19, 18]})
# 通过外部文件创建，csv，xlsx，json等
df = pd.read_csv('XXX.csv')

DataFrame存储

常见存储方式(csv, json, excel, pickle)

保存时，一般情况下是不需要保存索引的，因为读取的时候会自动生成索引。

df.to_csv('test.csv', index=False)  # 忽略索引
df.to_excel('test.xlsx', index=False)  # 忽略索引
df.to_json('test.json')  # 保存为json
df.to_pickle('test.pkl')  # 保存为二进制格式

DataFrame查看数据信息

显示摘要信息

在我们使用 DataFrame 之前都会查看数据的信息，个人首选 info ，它展现了数据集的行列信息，以及每列中的非空值的数量。

df.info()

显示描述性统计信息

能够较为直观的查看数值列的基本统计信息。

df.describe()

显示前 / 后 n行

默认显示5行，可指定显示的行数。

df.head(n)  # 可指定整数，输出前面n行
df.tail(n)  # 可指定整数，输出后面n行

显示索引、列信息

显示索引及列的基本信息。

df.columns  # 列信息
df.index  # 索引信息

显示每列的数据类型

显示列的名称及对应的数据类型。

df.dtypes

显示占用的内存大小

显示给列占用内存的大小，单位是：字节(byte)。

df.memory_usage()

定位某行数据

重点：无论是 loc 还是 iloc 使用的要领都是先指定行，再指定列，并且行与列表达式用 ， 分隔。如：df.loc[:, :] 获取所有行所有列的数据。

使用 loc() 定位

比如现在要定位 [索隆] 这行数据，有以下

df.loc[1, :]  # loc[index , columns] 行索引，列名，返回 Series 对象
df.loc[df['age'] > 18]  # 返回 DataFrame 对象
# 或者 df[df['age'] > 18]
# df.loc[df['name'] == '索隆']

使用 iloc 定位

使用 iloc 取第二行（索引从0开始），所有列的数据。

df.iloc[1, :]  # iloc[index1, index2] 行索引， 列索引

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

DataFrame必会基础操作

DataFrame创建

创建空的 DataFrame

常规 DataFrame 创建方式

DataFrame存储

常见存储方式(csv, json, excel, pickle)

DataFrame查看数据信息

显示摘要信息

显示描述性统计信息

显示前 / 后 n行

显示索引、列信息

显示每列的数据类型

显示占用的内存大小

定位某行数据

使用 loc() 定位

使用 iloc 定位

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

DataFrame必会基础操作

DataFrame创建

创建空的 DataFrame

常规 DataFrame 创建方式

DataFrame存储

常见存储方式(csv, json, excel, pickle)

DataFrame查看数据信息

显示摘要信息

显示描述性统计信息

显示 前 / 后 n行

显示索引、列信息

显示每列的数据类型

显示占用的内存大小

定位某行数据

使用 loc() 定位

使用 iloc 定位

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

显示前 / 后 n行