- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《百面机器学习》第七问：准确率的局限性-为什么分类的准确率很高，但应用起来效果很差？

王博Kings 发表于 2020/12/29 23:06:40 2020/12/29

【摘要】目录回顾知识点：实际场景： 1. 什么是分类的准确率？ 2. 如何避免由于样本比例不均衡导致准确率失效？回顾知识点：准确率： Accuracy 精确率： Precision 召回率： Recall 均方根误差： Root Mean Square Error, RMSE 实际场景：拿到奢侈品用户数据，训练和测试奢侈品用...

回顾知识点：

实际场景：

1. 什么是分类的准确率？

2. 如何避免由于样本比例不均衡导致准确率失效？

回顾知识点：

准确率： Accuracy

精确率： Precision

召回率： Recall

均方根误差： Root Mean Square Error, RMSE

实际场景：

拿到奢侈品用户数据，训练和测试奢侈品用户的分类模型，该模型分类准确率超过95%，但是实际应用效果很不好，还是会将结果显示为非奢侈用户，原因？

1. 什么是分类的准确率？

Accuracy = n(分类正确的) / n(总数)

准确率是分类问题的最简单直观的评价指标，但有明显问题。假如不同样本的比例非常不均衡，占大比例的类别往往会成为影响准确率的主要原因：比如，有100个样本，95个负样本，5个正样本，即使全部描述为负样本，准确率也是95%，那正样本等于说你一个都没有识别出来！！！

2. 如何避免由于样本比例不均衡导致准确率失效？

使用更为有效的平均准确率（每个类别下的样本准确率的算术平均值）。

文章来源: kings.blog.csdn.net，作者：人工智能博士，版权归原作者所有，如需转载，请联系作者。

原文链接：kings.blog.csdn.net/article/details/97615452

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《百面机器学习》第七问：准确率的局限性-为什么分类的准确率很高，但应用起来效果很差？

回顾知识点：

实际场景：

1. 什么是分类的准确率？

2. 如何避免由于样本比例不均衡导致准确率失效？

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品