《机器学习:算法视角(原书第2版)》 —2.2.3 混淆矩阵

举报
华章计算机 发表于 2019/12/21 13:02:14 2019/12/21
【摘要】 本节书摘来自华章计算机《机器学习:算法视角(原书第2版)》 一书中第2章,第2.2.3节,作者是[新西兰] 史蒂芬·马斯兰(Stephen Marsland),高 阳 商 琳 等译。

2.2.3 混淆矩阵

无论使用多少数据来测试已训练的算法,我们仍然需要确定结果是否良好。我们将在这里介绍一个适用于分类问题的方法,称为混淆矩阵(confusion matrix)。对于回归问题,事情更复杂,因为结果是连续的,因此最常用的是将在后面的章节中用来推动训练的平方和误差。在示例中,我们将看到这些方法的使用。

混淆矩阵是一个很好的简单方法:制作一个方阵,其中包含水平和垂直方向上的所有可能的类,并将表格顶部的类列为预测输出,然后沿左侧列为目标。例如,在(i,j)处的矩阵元素告诉我们在目标中有多少输入模式放入类i中,但是通过算法归入到类j中。在主对角线(leading diagonal)(从矩阵的左上角开始向下到右下角的对角线)上的任何东西都是正确的答案。假设我们有三个类:C1,C2,C3。现在我们计算当目标为C1时输出为C1类的次数,然后计算目标为C2时的输出次数,依此类推,直到我们填满表格为止:

image.png

这张表告诉我们,对于这三个类,大多数示例都被正确分类,但是C3类的两个示例被错误分类为C1,依此类推。对于少数类,这是查看输出的好方法。如果你只想要一个数字,则可以将主对角线上的元素之和除以矩阵中所有元素的总和,从而得到正确分类的百分比。这被称为精度(accuracy),我们将要看到它不是评估机器学习算法结果的唯一标准。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。