软件测试|数据分析神器pandas教程(二)

举报
霍格沃兹测试开发 发表于 2023/03/31 17:59:18 2023/03/31
【摘要】 前言上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。 数据结构-SeriesPandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。Series 由索引(index)和列组成,函数如下:pandas.Series( data, index, dtype, name, copy)参数说...

image.png

前言

上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。

数据结构-Series

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型,默认会自己判断
  • name:设置名称
  • copy:拷贝数据,默认为 False

创建一个简单的 Series 实例:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)

print(mydata)
----------------------
输出内容如下:
0    4
1    5
2    6
dtype: int64

从上可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据代码如下:

import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)


print(mydata[1])
----------------------------
输出结果如下:
5

我们也可以指定索引值,这样就可以按照索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata)

---------------------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

同样,我们也可以根据指定的索引输出内容,代码如下:

import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata["city"])

-----------------------
输出结果如下:
Ganzhou

类似字典方法,通过键值对对象创建Series,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place)

print(mydata)
---------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

从输出结果可以得知,字典的键成为了索引,如果我们需要字典中的一部分数据,只需要指定需要数据的索引即可,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'])

print(mydata)

----------------------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
dtype: object

我们同样可以设置 Series 名称参数,代码如下:

import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'], name="my hometown")

print(mydata)
--------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
Name: my hometown, dtype: object

总结

本文主要介绍了pandas的Series数据结构,这个数据结构较为简单,后续我们将介绍dataframe数据结构。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。