数据分析CSV文件
【摘要】 Python数据分析之csv文件1. csv文本概述2. 操作CSV文件2.1 describe()方法数据统计2.2 读取文件前几行数据2.3 读取某一行所有数据2.4 读取某几行的数据2.5 读取所有行和列数据2.6 读取某一列的所有行数据2.7 读取某几列的某几行2.8 读取某一行和某一列对应的数据3. CSV数据的导入导出(复制CSV文件)4. 实例演示1. csv文本概述CSV文件...
Python数据分析之csv文件
1. csv文本概述
CSV文件是一种纯文本文件,以
逗号
分隔数值的文件类型,可以使用任何文本编辑器进行编辑,它支持追加模式,节省内存开销。在数据库或电子表格中,常见的导入导出文件格式就是CSV格式。
2. 操作CSV文件
csv文件内容:
安装pandas库:
pip install pandas
读取csv文件中的所有数据
使用
pandas.read_csv()
读取
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
print(data)
结果演示:
姓名 年龄 职业 家庭地址 工资
0 张三 22 厨师 北京市 6000
1 李四 26 摄影师 湖南长沙 8000
2 王五 28 程序员 深圳 10000
3 Kaina 22 学生 黑龙江 2000
4 曹操 28 销售 上海 6000
2.1 describe()方法数据统计
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
print(data.describe())
结果演示:
年龄 工资
count 5.00000 5.000000
mean 25.20000 6400.000000
std 3.03315 2966.479395
min 22.00000 2000.000000
25% 22.00000 6000.000000
50% 26.00000 6000.000000
75% 28.00000 8000.000000
max 28.00000 10000.000000
2.2 读取文件前几行数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#读取前2行数据
# head_datas = data.head(0)
head_datas=data.head(2)
print(head_datas)
结果演示:
姓名 年龄 职业 家庭地址 工资
0 张三 22 厨师 北京市 6000
1 李四 26 摄影师 湖南长沙 8000
2.3 读取某一行所有数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#读取第一行所有数据
print(data.ix[0,])
结果演示:
姓名 张三
年龄 22
职业 厨师
家庭地址 北京市
工资 6000
2.4 读取某几行的数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#读取第一行、第二行、第四行的所有数据
print(data.ix[[0,1,3],:])
结果演示:
姓名 年龄 职业 家庭地址 工资
0 张三 22 厨师 北京市 6000
1 李四 26 摄影师 湖南长沙 8000
3 Kaina 22 学生 黑龙江 2000
2.5 读取所有行和列数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#读取所有行和列数据
print(data.ix[:,:])
结果演示:
姓名 年龄 职业 家庭地址 工资
0 张三 22 厨师 北京市 6000
1 李四 26 摄影师 湖南长沙 8000
2 王五 28 程序员 深圳 10000
3 Kaina 22 学生 黑龙江 2000
4 曹操 28 销售 上海 6000
2.6 读取某一列的所有行数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
# print(data.ix[:, 4])
print(data.ix[:,'工资'])
结果演示:
0 6000
1 8000
2 10000
3 2000
4 6000
Name: 工资, dtype: int64
2.7 读取某几列的某几行
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
print(data.ix[[0,1,3],['姓名','职业','工资']])
结果演示:
姓名 职业 工资
0 张三 厨师 6000
1 李四 摄影师 8000
3 Kaina 学生 2000
2.8 读取某一行和某一列对应的数据
import pandas as pd
path= 'D:\\test.csv'
with open(path)as file:
data=pd.read_csv(file)
#读取第三行的第三列
print("职业---"+data.ix[2,2])
结果演示:职业---程序员
3. CSV数据的导入导出(复制CSV文件)
读方式:
import pandas as pd
#1.读入数据
data=pd.read_csv(file)
写出数据:
import pandas as pd
#1.写出数据,目标文件是Aim.csv
data.to_csv('Aim.csv')
读取
网络数据
:
import pandas as pd
data_url = "https://raw.githubusercontent.com/mwaskom/seaborn-data/master/tips.csv"
#填写url读取
df = pd.read_csv(data_url)
4. 实例演示
test.csv
原文件内容
现在把
test.csv
中的内容复制到Aim.csv
中
import pandas as pd
file=open('test.csv')
#1.读取file中的数据
data=pd.read_csv(file)
#2.把data写到目标文件Aim.csv中
data.to_csv('Aim.csv')
print(data)
结果演示:
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)