《数据科学与分析:Python语言实现》 —1.4.3 数据挖掘

举报
华章计算机 发表于 2020/02/15 18:52:28 2020/02/15
【摘要】 本节书摘来自华章计算机《数据科学与分析:Python语言实现》 一书中第1章,第1.4.3节,作者是[英]赫苏斯·罗格尔–萨拉查(Jesús Rogel-Salazar),白 皓 刘江一 上官明乔 刁 娟 译。

1.4.3 数据挖掘

如果说没有问题就没有洞察力,那么没有数据挖掘,数据也就不存在了。在数据科学工作流中,数据挖掘和数据整理实际上是最耗时的。根据《纽约时报》的史蒂夫·洛尔的调研:数据科学家可能会把50%~80%的时间花在“看门人工作”(数据挖掘和整理)上,关于这一点我完全赞同。

数据准备是提取有价值的洞察力的关键,虽然有些人可能更愿意只关注建模部分(因为觉得那更有趣),但事实上当你经过数据挖掘后会对数据有从内到外的深层次理解,这也意味着解决任何新的或后续的问题都可能事半功倍。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

举报
请填写举报理由
0/200