《百面机器学习》第七问:准确率的局限性-为什么分类的准确率很高,但应用起来效果很差?

举报
王博Kings 发表于 2020/12/29 23:06:40 2020/12/29
【摘要】 目录 回顾知识点: 实际场景: 1. 什么是分类的准确率? 2. 如何避免由于样本比例不均衡导致准确率失效?   回顾知识点: 准确率  : Accuracy 精确率  : Precision 召回率  : Recall 均方根误差  : Root Mean Square Error,  RMSE  实际场景: 拿到奢侈品用户数据,训练和测试奢侈品用...

目录

回顾知识点:

实际场景:

1. 什么是分类的准确率?

2. 如何避免由于样本比例不均衡导致准确率失效?


 

回顾知识点:

准确率  : Accuracy

精确率  : Precision

召回率  : Recall

均方根误差  : Root Mean Square Error,  RMSE 

实际场景:

拿到奢侈品用户数据,训练和测试奢侈品用户的分类模型,该模型分类准确率超过95%,但是实际应用效果很不好,还是会将结果显示为非奢侈用户,原因?

1. 什么是分类的准确率?

Accuracy = n(分类正确的) / n(总数)

准确率是分类问题的最简单直观的评价指标,但有明显问题。假如不同样本的比例非常不均衡,占大比例的类别往往会成为影响准确率的主要原因:比如,有100个样本,95个负样本,5个正样本,即使全部描述为负样本,准确率也是95%,那 正样本等于说你一个都没有识别出来!!!

2. 如何避免由于样本比例不均衡导致准确率失效?

使用更为有效的平均准确率(每个类别下的样本准确率的算术平均值)。

文章来源: kings.blog.csdn.net,作者:人工智能博士,版权归原作者所有,如需转载,请联系作者。

原文链接:kings.blog.csdn.net/article/details/97615452

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。