学习笔记|模型的泛化能力

举报
darkpard 发表于 2021/09/09 17:06:26 2021/09/09
【摘要】 1. 泛化误差机器学习的泛化能力是指由学习到的模型对未知数据的预测能力,是模型本质上的重要性质。现实中采用最多的办法是通过测试误差来评价模型的泛化能力。但这种评价是依赖于测试数据集的。由于测试数据集的有限性,由此得到的评价结果很可能是不可靠的。本次学习试图从理论上对模型的泛化能力进行分析。 首先给出泛化误差的定义。如果学到的模型是f,那么用这个模型对未知数据预测的误差即为泛化误差:泛化误差反...

1. 泛化误差

机器学习的泛化能力是指由学习到的模型对未知数据的预测能力,是模型本质上的重要性质。现实中采用最多的办法是通过测试误差来评价模型的泛化能力。但这种评价是依赖于测试数据集的。由于测试数据集的有限性,由此得到的评价结果很可能是不可靠的。本次学习试图从理论上对模型的泛化能力进行分析。 首先给出泛化误差的定义。如果学到的模型是f,那么用这个模型对未知数据预测的误差即为泛化误差:


泛化误差反映了模型的泛化能力,如果一种机器学习的模型比另一种机器学习的模型具有更小的泛化误差,那么这种方法就更有效。事实上,泛化误差就是所学习到的模型的期望风险。

2. 泛化误差上界

机器学习的泛化能力分析往往是通过研究泛化误差的概率上界进行的,简称为泛化误差上界。具体来说,就是通过比较两种机器学习的泛化误差上界的大小来比较它们的优劣。泛化误差上界通常具有以下性质:它是样本容量的函数,当样本容量增加时,泛化上界趋于0:它是假设空间容量的函数,假设空间容量越大,模型就越难学,泛化误差上界就越大。

参考文献:

【1】统计学习方法(第2版),李航著,清华大学出版社

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。