《Spark机器学习进阶实战》——2.2.2 明确目标
【摘要】 本书摘自《Spark机器学习进阶实战》——书中的第2章,第2.2.2节,作者是马海平、于俊、吕昕、向海。
2.2.2 明确目标
明确目标是指通过调研结果定义问题、拆解问题,根据拆解的问题进一步量化指标,具体思路如下。
1)问题定义,对调研出来的问题进行定义,找出性价比最高的问题。
2)拆解问题,一个问题并非仅由一个原因引起,可能是很多因素互相影响的结果,这个时候要找出所有可能的因素,对问题进行拆解。比如网页搜索体验不好,原因可能是数据来源问题、相关性问题、Query解析问题、版本不稳定等。
3)量化指标,就是将指标进行量化,转化为数值型或者有序型指标。将指标进行量化,如版本稳定性这样的影响因子,可以通过崩溃日志和错误日志计算出每个版本的崩溃率、出错率等指标来表达。有时受限于我们拥有的数据,并不是列举的所有留存影响因素都能被处理成量化的指标,因此就需要通过技术手段获得这些数据。
【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)