机器学习 第四节 第一课
[toc]
Pandas
为什么要学习 pandas
numpy 已经能够帮助我们处理数据, 能够结合 matplotlib 解决我们数据分析的问题, 那么 pandas 学习的目的在什么地方呢?
numpy 能够帮助我们处理数值型数据, 但是这还不够.
很多时候, 我们的数据除了数值之外, 还有字符串, 时间序列等.
比如: 我们通过爬虫获取到了存储在数据库中的数据.
比如: 之前 youtube 的例子中除了数值之外还有国家的信息, 视频的分类 ( tag ) 信息, 标题信息等.
所以, numpy 能够帮我们处理数值, 但是 pandas 除了处理数值之外 ( 基于 numpy ), 还能够帮助我们处理其他类型的数据.
什么是 pandas
pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.
pandas 的常用数据类型
1. Series 一维, 带标签数组
2. DataFrame 二维, Series 容器
pandas 之 Series 创建
执行结果:
查看 Series 的 class
执行结果:
设置 Series 的 index
执行结果:
通过字典创建 Series
执行结果:
pandas 之 Series 切片和索引
执行结果:
执行结果:
pandas 之 Series 的索引和值
执行结果:
执行结果:
Series 对象本质上由两个数组构成:
一个数组构成对象的键 ( index, 索引 ), 一个数组构成对象的值 ( values ), 键 -> 值
ndarray 的很多方法都可以运用于 Series 类型, 比如 argmax, clip
Series 具有 where 方法, 但是结果和 ndarray 不同
文章来源: iamarookie.blog.csdn.net,作者:我是小白呀,版权归原作者所有,如需转载,请联系作者。
原文链接:iamarookie.blog.csdn.net/article/details/109502076
- 点赞
- 收藏
- 关注作者
评论(0)