- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

学习笔记|模型的泛化能力

darkpard 发表于 2021/09/09 17:06:26 2021/09/09

【摘要】 1. 泛化误差机器学习的泛化能力是指由学习到的模型对未知数据的预测能力，是模型本质上的重要性质。现实中采用最多的办法是通过测试误差来评价模型的泛化能力。但这种评价是依赖于测试数据集的。由于测试数据集的有限性，由此得到的评价结果很可能是不可靠的。本次学习试图从理论上对模型的泛化能力进行分析。首先给出泛化误差的定义。如果学到的模型是f，那么用这个模型对未知数据预测的误差即为泛化误差：泛化误差反...

1. 泛化误差

机器学习的泛化能力是指由学习到的模型对未知数据的预测能力，是模型本质上的重要性质。现实中采用最多的办法是通过测试误差来评价模型的泛化能力。但这种评价是依赖于测试数据集的。由于测试数据集的有限性，由此得到的评价结果很可能是不可靠的。本次学习试图从理论上对模型的泛化能力进行分析。首先给出泛化误差的定义。如果学到的模型是f，那么用这个模型对未知数据预测的误差即为泛化误差：

泛化误差反映了模型的泛化能力，如果一种机器学习的模型比另一种机器学习的模型具有更小的泛化误差，那么这种方法就更有效。事实上，泛化误差就是所学习到的模型的期望风险。

2. 泛化误差上界

机器学习的泛化能力分析往往是通过研究泛化误差的概率上界进行的，简称为泛化误差上界。具体来说，就是通过比较两种机器学习的泛化误差上界的大小来比较它们的优劣。泛化误差上界通常具有以下性质:它是样本容量的函数，当样本容量增加时，泛化上界趋于0：它是假设空间容量的函数，假设空间容量越大，模型就越难学，泛化误差上界就越大。

参考文献：

【1】统计学习方法（第2版），李航著，清华大学出版社

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

学习笔记|模型的泛化能力

1. 泛化误差

2. 泛化误差上界

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

学习笔记|模型的泛化能力

1. 泛化误差

2. 泛化误差上界

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品