- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《机器学习：算法视角（原书第2版）》 —2.2.7　度量精度

华章计算机发表于 2019/12/21 13:12:56 2019/12/21

【摘要】本节书摘来自华章计算机《机器学习：算法视角（原书第2版）》一书中第2章，第2.2.7节，作者是[新西兰]　史蒂芬·马斯兰（Stephen Marsland），高　阳　商　琳　等译。

2.2.7　度量精度

有一种不同的方法可以评估学习系统的精度，遗憾的是，这种方法虽然具有不同的含义，但也使用了词语精度（precision）。这里的概念是将机器学习算法视为度量系统。我们提供输入并查看得到的输出。甚至在将它们与目标值进行比较之前，我们可以度量一些关于算法的内容：如果输入一组类似的输入，那么希望得到类似的输出。这种算法可变性的度量也称为精度，它告诉我们算法所做的预测是多么可重复。将精度视为概率分布的方差可能是有用的：它指出在平均值上下浮动多少。

关键在于，算法是精确的并不意味着它是准确的——如果总是给出错误的预测，则可能是完全错误的。算法预测与现实匹配程度的一个衡量标准称为真实度（trueness），它可以被定义为正确输出和预测之间的平均距离。除非某些类的某些概念彼此相似，否则真实度通常对分类问题没有多大意义。图2-9以传统方式说明了真实度和精度的概念：作为飞镖游戏，有四个例子，玩家投掷的三个飞镖具有不同的真实度和精度。

图2-9　假设玩家的目标是飞镖得分最高的20分翻倍（每个得分的数字都是它们标记的数字，外侧的窄带得分翻两倍，内侧的窄带得分翻三倍；位于“靶心”的外侧和内侧分别得25分和50分），这四张照片分别显示了不同的结果。左上角：非常准确：高精度和真实度。右上角：低精度，但良好的真实度。左下角：高精度，但低真实度。右下角：合理的真实度和精度，但实际输出不是很好（感谢Stefan Nowicki提供用于拍摄这些照片的飞镖）本节考虑了机器学习的终点，查看输出，并考虑了在输入数据方面需要做多少数据集等。在下一节中，我们将回到起点，考虑如何通过处理概率来分析数据集。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《机器学习：算法视角（原书第2版）》 —2.2.7　度量精度

2.2.7　度量精度

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《机器学习：算法视角（原书第2版）》 —2.2.7 度量精度

2.2.7 度量精度

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品

《机器学习：算法视角（原书第2版）》 —2.2.7　度量精度

2.2.7　度量精度