《scikit-learn机器学习常用算法原理及编程实战》—3.8 复习题
【摘要】 本书摘自《scikit-learn机器学习常用算法原理及编程实战》一书中的第3章,第3.8节,编著是黄永昌 .
3.8 复习题
1.什么是过拟合?什么是欠拟合?怎么样去诊断算法是否过拟合或欠拟合?
2.模型的拟合成本是什么意思?它和模型的准确性有什么关系?
3.我们有哪些指标来评价一个模型的好坏?
4.为什么需要交叉验证数据集?
5.什么是学习曲线?为什么要画学习曲线?
6.打开ch03.02.ipynb,运行这个示例代码。
7.参考ch03.02.ipynb,换成随机森林回归算法sklearn.ensemble.RandomForestRegressor来拟合曲线,并画出学习曲线。提示:读者可以阅读scikit-learn文档以获得帮助。不过不需要深入了解算法原理,由于scikit-learn提供了一致的接口,对大部分有编程经验的读者,这个任务不会是太大的障碍。
8.为什么需要查准率和召回率来评估模型的好坏?查准率和召回率适合哪些问题领域?
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)