机器学习算法源码全解析(一)-带你深入理解随机森林(RandomForest)原理及如何防止 Dropout

举报
格图洛书 发表于 2021/11/18 23:36:54 2021/11/18
【摘要】 前言 要想了解如何增强机器学习模型性能,我们需要知道如何降低模型的误差。所以首先我们必须明白模型误差是由偏差(Bias)和方差(Variance)组成的。偏差是指样本预测值的平均值与样本真实值的差,而方差是指样本预测值偏离样本预测值平均值的程度。 其中 偏差(Bias)可以描述模型的准确性 而方差(Variance)可以描述模...

前言

要想了解如何增强机器学习模型性能,我们需要知道如何降低模型的误差。所以首先我们必须明白模型误差是由偏差(Bias)和方差(Variance)组成的。偏差是指样本预测值的平均值样本真实值的差,而方差是指样本预测值偏离样本预测值平均值的程度
其中

  • 偏差(Bias)可以描述模型的准确性
  • 而方差(Variance)可以描述模型的稳定性,一定程度上反映了模型泛化能力

所以增强机器学习模型性能就意味着需要提高模型的准确性和稳定性。

我们来看看下图,直观的感受一下偏差(Bias)和方差(Variance)对模型的影响,你可以将其想象一个同学的一学期的考试情况,越靠红心代表考试得分越高:

  • 右下角同学——学渣,每次考试分数不高,而且成绩还不稳定,属于高偏差高方差的模型。
  • 左下角同学——学庸,成绩很稳定,可是每次考试得分都不高,属于方差较小可是偏差较大的模型。
  • 右上角的同学——学聪,成绩还不错,可是忽高忽低,不稳定,属于偏差较小可是方差较大的模型。
  • 左上角的同学——学霸,成键很棒,而且极其稳定,属于偏差较小,方差也小的模型。

文章来源: wenyusuran.blog.csdn.net,作者:文宇肃然,版权归原作者所有,如需转载,请联系作者。

原文链接:wenyusuran.blog.csdn.net/article/details/107333384

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。