《Spark机器学习进阶实战》——3.3.2 准确率、召回率和F1值
【摘要】 本书摘自《Spark机器学习进阶实战》——书中的第3章,第3.3.2节,作者是马海平、于俊、吕昕、向海。
3.3.2 准确率、召回率和F1值
准确率和召回率是广泛用于机器学习分类领域的两个度量值,用来评价结果的质量。
准确率(Precision,又称查准率)是针对预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。
召回率(Recall,又称查全率)是针对样本而言的,它表示的是样本中的正例有多少被预测正确了,在不平衡分类问题中使用较多。
借助上面的定义,准确率(P)和召回率(R)可以表示为:
在实际应用中,准确率高时,召回率往往偏低,而召回率高时,准确率往往不能令人满意。因此在综合比较两个分类器的时候,经常采用的评估指标是F1值。F1值是准确率和召回率的调和平均值,计算公式如下。可以看出,F1值更接近于准确率和召回率中较小的值。
不同的分类场景对准确率和召回率的重视程度有所不同。例如在新闻推荐中,为了不影响用户体验,给用户推荐的新闻尽量要是用户感兴趣的,该情况下准确率比召回率更加重要。而在欺诈预测中,需要尽量覆盖所有欺诈行为,该情况下召回率更为重要。F1值的一般形式Fβ则可以根据分类场景需要来实现对准确率或召回率的权衡。Fβ的计算方法如下:
当β<1时召回率更为重要,β=1时Fβ就是前面所讲述的F1值,而β>1时准确率更为重要。
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)