机器学习 第四节 第一课

举报
我是小白呀iamarookie 发表于 2021/09/10 23:56:16 2021/09/10
【摘要】 [toc] Pandas 为什么要学习 pandas numpy 已经能够帮助我们处理数据, 能够结合 matplotlib 解决我们数据分析的问题, 那么 pandas 学习的目的在什么地方呢? numpy 能够帮助我们处理数值型数据, 但是这还不够. 很多时候, 我们的数据除了数值之外, 还有字符串, 时间序列等. 比如...

[toc]

Pandas

为什么要学习 pandas

numpy 已经能够帮助我们处理数据, 能够结合 matplotlib 解决我们数据分析的问题, 那么 pandas 学习的目的在什么地方呢?

numpy 能够帮助我们处理数值型数据, 但是这还不够.

很多时候, 我们的数据除了数值之外, 还有字符串, 时间序列等.

比如: 我们通过爬虫获取到了存储在数据库中的数据.

比如: 之前 youtube 的例子中除了数值之外还有国家的信息, 视频的分类 ( tag ) 信息, 标题信息等.

所以, numpy 能够帮我们处理数值, 但是 pandas 除了处理数值之外 ( 基于 numpy ), 还能够帮助我们处理其他类型的数据.

什么是 pandas

pandas is an open source, BSD-licensed library providing high-performance, easy-to-use data structures and data analysis tools for the Python programming language.

pandas 的常用数据类型

1. Series 一维, 带标签数组

2. DataFrame 二维, Series 容器

pandas 之 Series 创建

执行结果:

查看 Series 的 class

执行结果:

设置 Series 的 index

执行结果:

通过字典创建 Series

执行结果:

pandas 之 Series 切片和索引

执行结果:

执行结果:

pandas 之 Series 的索引和值

执行结果:

执行结果:

Series 对象本质上由两个数组构成:

一个数组构成对象的键 ( index, 索引 ), 一个数组构成对象的值 ( values ), 键 -> 值

 ndarray 的很多方法都可以运用于 Series 类型, 比如 argmax, clip

Series 具有 where 方法, 但是结果和 ndarray 不同

 

文章来源: iamarookie.blog.csdn.net,作者:我是小白呀,版权归原作者所有,如需转载,请联系作者。

原文链接:iamarookie.blog.csdn.net/article/details/109502076

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。