《scikit-learn机器学习常用算法原理及编程实战》—3.8 复习题

举报
华章计算机 发表于 2019/05/31 17:14:20 2019/05/31
【摘要】 本书摘自《scikit-learn机器学习常用算法原理及编程实战》一书中的第3章,第3.8节,编著是黄永昌 .

3.8  复习题

  1.什么是过拟合?什么是欠拟合?怎么样去诊断算法是否过拟合或欠拟合?

  2.模型的拟合成本是什么意思?它和模型的准确性有什么关系?

  3.我们有哪些指标来评价一个模型的好坏?

  4.为什么需要交叉验证数据集?

  5.什么是学习曲线?为什么要画学习曲线?

  6.打开ch03.02.ipynb,运行这个示例代码。

  7.参考ch03.02.ipynb,换成随机森林回归算法sklearn.ensemble.RandomForestRegressor来拟合曲线,并画出学习曲线。提示:读者可以阅读scikit-learn文档以获得帮助。不过不需要深入了解算法原理,由于scikit-learn提供了一致的接口,对大部分有编程经验的读者,这个任务不会是太大的障碍。

  8.为什么需要查准率和召回率来评估模型的好坏?查准率和召回率适合哪些问题领域?

 


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。