Pyecharts结合Pandas绘制图表
前言
数据的可视化是我们数据分析最重要的环节,图表可以化复杂为简洁,化抽象为具体,使读者或听众更容易理解.数据可视化为图表,能让数据更加直观,更加触手可及,让企业能够更迅速,更准确地做出商业决策.让企业能够更好地在所处的领域有所成就.甚至立于不败之地.之前学过pyecharts的绘图库,它的强大让我很震撼,但是再好的绘图库只是前端的一种表现形式,数据才是数据分析的最重要对象,之前《Python 绘制精美可视化数据分析图表 (二)-pyecharts》的数据都是我们手动创建的数据,这显然不符合我们日常开发需求,做数据分析,往往会有大量数据需要整理,数据量越大,得出的结论会更加准确.所以我们的数据会来自不同的渠道.会存储在不同类型的文件中.我们平时的数据一般来自Excel,csv,TXT,json等等.Excel正是最常用的数据存储媒介。如果说数据是米,那这些存储媒介就是粮仓。而Pandas是和这些文件媒介结合使用最好的数据处理库之一,Pandas是一个强大的分析结构化数据的工具集, 可以对各种数据进行运算操作,比如归并、再成形、选择,还有数据清洗和数据加工特征。广泛应用在学术、金融、统计学等各个数据分析领域。
准备
安装pyecharts和Pandas
pip install pandas
pip install pyecharts
默认安装符合Python版本的最新的版本
可通过代码查看安装版本
import pyecharts
import pandas
print(pyecharts.__version__)
print(pandas.__version__)
运行结果:
1.9.1
1.0.5
pyecharts 结合 pandas 绘制一周销售情况折线图
示例中的Excel数据:
第一步当然是导入Python库,导入pyecharts和pandas
from pyecharts.charts import Line
from pyecharts import options as opts
import pandas as pd
使用pandas导入excel表格中的数据
df = pd.read_excel(r'data.xlsx')
对数据进行转置,让数据变成适合我们需要的格式
df2 = pd.DataFrame(df.values.T, index=df.columns, columns=df.index)#转置
处理数据:把数据方式分开放到对应的list
创建三个list来存储数据
indexs = [] # 行索引
columns = [] # 列索引
data = [] # 每一列的数据,二维列表
使用for循环处理数据
#获取X轴变量
for index in df2.index:
indexs.append(index)
#获取每行索引
for column in df2.columns:
columns.append(column)
#把每行数据放到一个list
for i in range(0,len(columns)):
data_ = []
for j in df2.iloc[:,i]:
data_.append(j)
data.append(data_)
数据处理结果:
涉及到多条折线展示,使用层叠多图函数overlap()来处理,overlap()能让多个图形在同一图表同时展示,不但可以层叠同一类型还可以层叠多种类型的图形,比如:直方图和折线图
创建一个xiaoshou()函数:
def xiaoshou() -> Line:
先设置基本配置
c = (
Line()
.add_xaxis(indexs[1:])
.set_global_opts(title_opts=opts.TitleOpts(title="各区域一周销售情况"))
)
循环data列表绘制图表,不管后面增加多少行多少列数据都能自适应
for i in range(0,len(columns)):
c_ = (
Line()
.add_xaxis(indexs[1:])
.add_yaxis(data[i][0], data[i][1:])
)
c.overlap(c_) # 堆叠
return c
然后统一渲染
xiaoshou().render()
最终效果:
总结
使用for循环处理数据再放到pyecharts进行渲染绘制图表,能够很好自适应表格数据的删减
- 点赞
- 收藏
- 关注作者
评论(0)