《Spark机器学习进阶实战》——3.3.2 准确率、召回率和F1值

举报
华章计算机 发表于 2019/06/01 22:20:16 2019/06/01
【摘要】 本书摘自《Spark机器学习进阶实战》——书中的第3章,第3.3.2节,作者是马海平、于俊、吕昕、向海。

3.3.2 准确率、召回率和F1值

准确率和召回率是广泛用于机器学习分类领域的两个度量值,用来评价结果的质量。

准确率(Precision,又称查准率)是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。

召回率(Recall,又称查全率)是针对样本而言的,它表示的是样本中的正例有多少被预测正确了,在不平衡分类问题中使用较多。

借助上面的定义,准确率(P)和召回率(R)可以表示为:

image.png

在实际应用中,准确率高时,召回率往往偏低,而召回率高时,准确率往往不能令人满意。因此在综合比较两个分类器的时候,经常采用的评估指标是F1值。F1值是准确率和召回率的调和平均值,计算公式如下。可以看出,F1值更接近于准确率和召回率中较小的值。

image.png

不同的分类场景对准确率和召回率的重视程度有所不同。例如在新闻推荐中,为了不影响用户体验,给用户推荐的新闻尽量要是用户感兴趣的,该情况下准确率比召回率更加重要。而在欺诈预测中,需要尽量覆盖所有欺诈行为,该情况下召回率更为重要。F1值的一般形式Fβ则可以根据分类场景需要来实现对准确率或召回率的权衡。Fβ的计算方法如下:

image.png

当β<1时召回率更为重要,β=1时Fβ就是前面所讲述的F1值,而β>1时准确率更为重要。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。