《Spark机器学习进阶实战》——2.2.2 明确目标

举报
华章计算机 发表于 2019/05/31 01:04:29 2019/05/31
【摘要】 本书摘自《Spark机器学习进阶实战》——书中的第2章,第2.2.2节,作者是马海平、于俊、吕昕、向海。

2.2.2 明确目标

明确目标是指通过调研结果定义问题、拆解问题,根据拆解的问题进一步量化指标,具体思路如下。

1)问题定义,对调研出来的问题进行定义,找出性价比最高的问题。

2)拆解问题,一个问题并非仅由一个原因引起,可能是很多因素互相影响的结果,这个时候要找出所有可能的因素,对问题进行拆解。比如网页搜索体验不好,原因可能是数据来源问题、相关性问题、Query解析问题、版本不稳定等。

3)量化指标,就是将指标进行量化,转化为数值型或者有序型指标。将指标进行量化,如版本稳定性这样的影响因子,可以通过崩溃日志和错误日志计算出每个版本的崩溃率、出错率等指标来表达。有时受限于我们拥有的数据,并不是列举的所有留存影响因素都能被处理成量化的指标,因此就需要通过技术手段获得这些数据。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。