《Spark机器学习进阶实战》——2.2 数据分析流程

举报
华章计算机 发表于 2019/05/31 01:02:08 2019/05/31
【摘要】 本书摘自《Spark机器学习进阶实战》——书中的第2章,第2.2.1节,作者是马海平、于俊、吕昕、向海。

2.2 数据分析流程

数据分析可以帮助我们从数据中发现有用信息,找出有建设性的结论,并基于分析结论辅助决策。如图2-2所示,image.png数据分析流程主要包括业务调研、明确目标、数据准备、特征处理、模型训练与评估、输出结论6个关键环节。

数据分析能力并非一朝一夕养成的,需要长期扎根业务进行积累,需要长期根据数据分析流程一步一个脚印地分析问题,培养自己对数据的敏感度,从而养成用数据分析、用数据说话的习惯。当你可以基于一些数据,根据自己的经验做出初步的判断和预测,你就基本拥有数据思维了。

接下来对数据分析流程进行针对性的讲解。

2.2.1 业务调研

数据分析的常见困难是不知道最值得调研的问题是什么、无法获取大量可靠的数据、复杂问题难以拆解、难以追查问题背后的真实原因、难以提前预判方案是否可行。

调研主要分为3个阶段。

1)调研准备阶段,这个阶段要进行调研计划编写和确认、调研背景资料的准备,这个阶段的工作质量将对能否顺利开展调研工作起到关键保障作用。

2)调研实施阶段,根据调研计划完成各项调研工作,倾听客户的痛点、难点、堵点,思考解决痛点、攻克难点、疏通堵点的思路和方法。

3)调研总结阶段,根据现场调研结果,总结并提出合理数据分析解决方案,找出问题的真正原因,趁热打铁,把后续工作落实到一定程度,此时调研工作才能算结束。

调研是数据分析的起点,也是指引后续分析的灯塔。很多时候,调研清楚了,数据采集到了,结论就很明显了。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。