【《机器学习》周志华学习笔记2.4】~比较检验

举报
王博Kings 发表于 2020/12/30 01:01:55 2020/12/30
【摘要】 机器学习中的性能比较为什么 比较复杂? 首先,我们希望比较的是泛化 性能,然而通过实验评估获得的只是测试集上的性能,两者对比结果可能未必相同测试集上的性能与测试集本身选择有很大的关系,不同大小的测试集会得到不同的结果,即便是相同大小的测试集,若测试样例不同,测试结果也可能不同很多机器学习算法本身有一定的随机性,即便用相同的参数设置,在同一个测试集多次运行,其 结果也可能不同...

机器学习中的性能比较为什么 比较复杂?

  1. 首先,我们希望比较的是泛化 性能,然而通过实验评估获得的只是测试集上的性能,两者对比结果可能未必相同
  2. 测试集上的性能与测试集本身选择有很大的关系,不同大小的测试集会得到不同的结果,即便是相同大小的测试集,若测试样例不同,测试结果也可能不同
  3. 很多机器学习算法本身有一定的随机性,即便用相同的参数设置,在同一个测试集多次运行,其 结果也可能不同。

统计假设检验(hypothesis test)为学习器性能 比较提供了重要依据!

假设检验 

假设检验中的“假设”是对学习器 泛化错误率分布额某种判断或者猜想。现实任务中并不知道学习器的 泛化错误率,只能获知其测试错误率\hat{\epsilon },泛化错误率与测试错误率相差很近,因此根据测试错误率推出泛化错误率 的分布。

泛化错误率为\epsilon的学习器在一个样本上犯错的概率是\epsilon

测试错误率\hat{\epsilon }意味着m个测试样本中恰好有{\color{Red} \hat{\epsilon }\times m}个被误分类

假定独立采样,泛化错误率为\epsilon的学习器将其中{\color{Blue} {m}'{\color{Blue} }}个样本误分类,其余样本全部分类正确的概率{\epsilon^m^'(1-\epsilon )^{m-m^'}}

 

 

 

文章来源: kings.blog.csdn.net,作者:人工智能博士,版权归原作者所有,如需转载,请联系作者。

原文链接:kings.blog.csdn.net/article/details/89152182

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。