《R数据科学实战:工具详解与案例分析 》 —2.3.4 replace_na / drop_na/—默认值处理工具

举报
华章计算机 发表于 2019/11/09 20:04:59 2019/11/09
【摘要】 本节书摘来自华章计算机《R数据科学实战:工具详解与案例分析》 一书中第二章,第2.3.4节,作者刘 健 邬书豪 。

2.3.4 replace_na / drop_na/—默认值处理工具

一旦明确了默认值的替代方式,replace_na和drop_na两个函数就可以通过对指定列的查询来将NA替换成需要的数值,例如,去掉所有存在默认值的观察值。表2-16中列出了函数的功能简介及使用时应注意的事项。读者可以参照帮助文档中的例子结合表2-16中的提示来自行练习这两个函数的功能。

表2-16 函数replace_na和drop_na对比

image.png

 

下面的代码列出了如何使用两个函数:

  > df %>%

gather(key, value, -序号) %>%

separate(key, c("性别","key")) %>%

replace_na(list(value = "missing"))

  > df %>%

gather(key, value, -序号) %>%

separate(key, c("性别","key")) %>%

drop_na()

这里必须提醒一下读者关于默认值替换的情况,将所有默认值全部替换成0是很危险的行为,不推荐使用这种做法,因为0代表该数据是存在的,只是数值为0,而默认值则可能代表数据不存在和存在两种情况,只是因为某些原因而导致数据采集失败。因此对默认值的处理一定要视具体情况而定。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。