【Dive into Deep Learning / 动手学深度学习】第二章 - 第二节:数据预处理

举报
海轰Pro 发表于 2022/05/02 00:49:09 2022/05/02
【摘要】 目录 前言2.2. 数据预处理2.2.1. 读取数据集2.2.2. 处理缺失值2.2.3. 转换为张量格式 结语 前言 Hello! 非常感谢您阅读海轰的文章,倘若文中有错误...

前言

Hello!
非常感谢您阅读海轰的文章,倘若文中有错误的地方,欢迎您指出~
 
自我介绍 ଘ(੭ˊᵕˋ)੭
昵称:海轰
标签:程序猿|C++选手|学生
简介:因C语言结识编程,随后转入计算机专业,获得过国家奖学金,有幸在竞赛中拿过一些国奖、省奖…已保研。
学习经验:扎实基础 + 多做笔记 + 多敲代码 + 多思考 + 学好英语!
 
唯有努力💪
 

知其然 知其所以然!

 
本文仅记录自己感兴趣的内容

2.2. 数据预处理

2.2.1. 读取数据集

创建一个人工数据集,并存储在CSV(逗号分隔值)文件 路径: ../data/house_tiny.csv

import os

os.makedirs(os.path.join('..', 'data'), exist_ok=True)
data_file = os.path.join('..', 'data', 'house_tiny.csv')
with open(data_file, 'w') as f:
    f.write('NumRooms,Alley,Price\n')  # 列名
    f.write('NA,Pave,127500\n')  # 每行表示一个数据样本
    f.write('2,NA,106000\n')
    f.write('4,NA,178100\n')
    f.write('NA,NA,140000\n')

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

../data/house_tiny.csv表示在上一层目录新建一个data文件夹,再在其中创建一个csv文件,存放数据
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

os.makedirs() 方法用于递归创建目录

在这里插入图片描述

参考:https://blog.csdn.net/viven_hui/article/details/101274815


读取csv文件中的数据

import pandas as pd

data = pd.read_csv(data_file)
print(data)

  
 
  • 1
  • 2
  • 3
  • 4

在这里插入图片描述

2.2.2. 处理缺失值

使用fillna处理缺失值
在这里插入图片描述

fillna的使用:https://blog.csdn.net/lady_chen/article/details/114294852


get_dummies的使用

进行one-hot编码

在这里插入图片描述
在这里插入图片描述

2.2.3. 转换为张量格式

在这里插入图片描述

结语

学习资料:http://zh.d2l.ai/

文章仅作为个人学习笔记记录,记录从0到1的一个过程

希望对您有一点点帮助,如有错误欢迎小伙伴指正

在这里插入图片描述

文章来源: haihong.blog.csdn.net,作者:海轰Pro,版权归原作者所有,如需转载,请联系作者。

原文链接:haihong.blog.csdn.net/article/details/124528308

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。