《数据科学与分析:Python语言实现》 —1.4.3 数据挖掘
【摘要】 本节书摘来自华章计算机《数据科学与分析:Python语言实现》 一书中第1章,第1.4.3节,作者是[英]赫苏斯·罗格尔–萨拉查(Jesús Rogel-Salazar),白 皓 刘江一 上官明乔 刁 娟 译。
1.4.3 数据挖掘
如果说没有问题就没有洞察力,那么没有数据挖掘,数据也就不存在了。在数据科学工作流中,数据挖掘和数据整理实际上是最耗时的。根据《纽约时报》的史蒂夫·洛尔的调研:数据科学家可能会把50%~80%的时间花在“看门人工作”(数据挖掘和整理)上,关于这一点我完全赞同。
数据准备是提取有价值的洞察力的关键,虽然有些人可能更愿意只关注建模部分(因为觉得那更有趣),但事实上当你经过数据挖掘后会对数据有从内到外的深层次理解,这也意味着解决任何新的或后续的问题都可能事半功倍。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)