Python可视化数据分析07、Pandas_CSV文件读写

举报
红目香薰 发表于 2022/07/29 10:35:05 2022/07/29
【摘要】 ​ ​编辑Python可视化数据分析07、Pandas_CSV文件读写📋前言📋💝博客:【红目香薰的博客_CSDN博客-计算机理论,2022年蓝桥杯,MySQL领域博主】💝✍本文由在下【红目香薰】原创,首发于CSDN✍🤗2022年最大愿望:【服务百万技术人次】🤗💝Python初始环境地址:【Python可视化数据分析01、python环境搭建】💝 环境需求环境:win10开发工...

 编辑

Python可视化数据分析07、Pandas_CSV文件读写

📋前言📋

💝博客:【红目香薰的博客_CSDN博客-计算机理论,2022年蓝桥杯,MySQL领域博主】💝

✍本文由在下【红目香薰】原创,首发于CSDN✍

🤗2022年最大愿望:【服务百万技术人次】🤗

💝Python初始环境地址:【Python可视化数据分析01、python环境搭建】💝 


环境需求

环境:win10

开发工具:PyCharm Community Edition 2021.2

数据库:MySQL5.6

目录

Python可视化数据分析07、Pandas_CSV文件读写

📋前言📋

环境需求


CSV文件

CSV文件操作

CSV写入

CSV读取



CSV文件

逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。

CSV文件操作

在Pandas模块中,使用to_csv()函数将DataFrame对象写入到CSV文件。
to_csv()函数的参数说明如下:
path_or_buf:字符串或文件句柄,默认无文件路径或对象,如果没有提供,结果将返回为字符串。可以是URL,可用URL类型包括http、ftp、s3和文件。
sep:指定分隔符。如果不指定参数,则会尝试使用逗号分隔。

CSV写入

import pandas as pd

df = pd.DataFrame({"id": [1, 2, 3], "name": ["雷静", "小凤", "春梦"], "age": ["21", "22", "20"]})
print(df)
# 写入到csv文件
df.to_csv("test.csv", index=False, sep=",", encoding="gbk")  # 使用gbk在用excel的时候能显示中文

编辑
import pandas as pd

df = pd.DataFrame({"id": [1, 2, 3], "name": ["雷静", "小凤", "春梦"], "age": ["21", "22", "20"]})
print(df)
# 写入到csv文件
df.to_csv("test.csv", index=False, sep=",", encoding="utf-8")  # 使用gbk在用excel的时候能显示中文


编辑

编辑

CSV读取

import pandas as pd

df = pd.read_csv("test.csv", encoding="utf-8")
print(df)

编辑

import pandas as pd

df = pd.read_csv("test.csv", encoding="gbk")
#  基础信息
print(df.info)
# 查看列名
print(df.columns)
# 查看各列数据类型
print(df.dtypes)
# 查看下标
print(df.index)
#  数据浏览前2条
print(df.head(2))
#  查看name到age列
print(df.loc[:, "name":"age"])
#  基本统计
print("最大年龄:", df.age.max())
print("平均年龄:", df.age.mean())
# 查询
print(df[df.name == "春梦"])
# 排序·True正序False倒序
print(df.sort_values(by=["age"], ascending=False))
# 在第二列【下标是1】添加列
df.insert(1, "sex", "女")
print(df)
# 在最后添加列
df["introduce"] = "巾帼"
print(df)
# 删除某行
df = df.drop(1)
print(df)
# 替换
value = pd.Series([1, "女", "雷静静", 20, "大眼姑娘"], index=["id", "sex", "name", "age", "introduce"])
df.loc[0] = value
value = pd.Series([4, "女", "小龙女", 18, "冰山美人"], index=["id", "sex", "name", "age", "introduce"])
df.loc[3] = value
print(df)
# 条数
print(len(df))


<bound method DataFrame.info of    id name  age
0   1   雷静   21
1   2   小凤   22
2   3   春梦   20>
Index(['id', 'name', 'age'], dtype='object')
id       int64
name    object
age      int64
dtype: object
RangeIndex(start=0, stop=3, step=1)
   id name  age
0   1   雷静   21
1   2   小凤   22
  name  age
0   雷静   21
1   小凤   22
2   春梦   20
最大年龄: 22
平均年龄: 21.0
   id name  age
2   3   春梦   20
   id name  age
1   2   小凤   22
0   1   雷静   21
2   3   春梦   20
   id sex name  age
0   1   女   雷静   21
1   2   女   小凤   22
2   3   女   春梦   20
   id sex name  age introduce
0   1   女   雷静   21        巾帼
1   2   女   小凤   22        巾帼
2   3   女   春梦   20        巾帼
   id sex name  age introduce
0   1   女   雷静   21        巾帼
2   3   女   春梦   20        巾帼
   id sex name  age introduce
0   1   女  雷静静   20      大眼姑娘
2   3   女   春梦   20        巾帼
3   4   女  小龙女   18      冰山美人
3

Process finished with exit code 0

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。