python使用pandas处理excel数据

举报
yd_221104950 发表于 2020/12/01 00:23:52 2020/12/01
4.5k+ 0 0
【摘要】 使用Python Pandas库读取excel文件(.xlsx, .xls)。 使用pandas的 read_excel()方法来读取excel数据,可以读取第一个sheet,指定的sheet,多个sheet或所有的sheet。Pandas会将这些数据转化成一个 DataFrame结构,它是一个扁平的结构来的。接着就可以对数据进行数据分析了。 1.安装Anaconda...

使用Python Pandas库读取excel文件(.xlsx, .xls)。 使用pandas的 read_excel()方法来读取excel数据,可以读取第一个sheet,指定的sheet,多个sheet或所有的sheet。Pandas会将这些数据转化成一个 DataFrame结构,它是一个扁平的结构来的。接着就可以对数据进行数据分析了。

1.安装Anaconda3

我们使用anaconda3来安装和管理python库。在Anaconda的官方网站下载一个下来安装即可。

2.安装xlrd

Pandas的read_excel方法内部会使用xlrd库。xlrd是一个用于读取excel文件(.xlsx, .xls)的库。使用Anaconda安装xlrd库:

$ conda install xlrd

  
 

3.安装pandas

作为本篇的主角pandas,当然是要安装的了。

$ conda install pandas

  
 

4.使用pandas读取excel数据

默认读取第一张sheet。


import pandas as pd

df = pd.read_excel('sample.xlsx')

print(df)

  
 

4.1.读取指定sheet的数据

通过指定read_excel方法的sheet_name参数来指定。可以通过数字来指定是第几张:

import pandas as pd

df_sheet_index = pd.read_excel('sample.xlsx', sheet_name=1)

print(df_sheet_index)

  
 

也可以直接指定sheet的名字:

import pandas as pd

df_sheet_name = pd.read_excel('sample.xlsx', sheet_name='sheet2')

print(df_sheet_name)

  
 

4.2.读取多张sheet的数据

可以通过数字或名称来指定这几张sheet。

import pandas as pd

df_sheet_multi = pd.read_excel('sample.xlsx', sheet_name=[0, 'sheet2'])

print(df_sheet_multi)

  
 

4.3.读取所有的sheet

import pandas as pd

df_sheet_all = pd.read_excel('sample.xlsx', sheet_name=None)
print(df_sheet_all)

  
 

下一篇《用pandas做数据分析》

文章来源: blog.csdn.net,作者:WongKyunban,版权归原作者所有,如需转载,请联系作者。

原文链接:blog.csdn.net/weixin_40763897/article/details/109155716

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

作者其他文章

评论(0

抱歉,系统识别当前为高风险访问,暂不支持该操作

    全部回复

    上滑加载中

    设置昵称

    在此一键设置昵称,即可参与社区互动!

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

    *长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。