数据挖掘领域十大经典算法初探
【摘要】
博主说明: 1、原文献非最新文章,只是本人向来对算法比较敏感、感兴趣,便把原文细看了下,
翻译过程中,有参考一些网友翻译的文章,但个人认为,阐述皆不够精准,且都是泛泛而谈,
故此,做了此份翻译,希望,为读者提供一个较权威而详细的文档资料。
2、同时,也可于闲余之际择其一二好好研究、剖析下此数据挖掘领域的十大经典算法。
文...
博主说明:
以下就是从参加评选的18种候选算法中,最终决选出来的十大经典算法:
一、C4.5
C4.5,是机器学习算法中的一个分类决策树算法,
它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法
ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。
决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。
C4.5相比于ID3改进的地方有:
1、用信息增益率来选择属性。
ID3选择属性用的是子树的信息增益,这里可以用很多方法来定义信息,ID3使用的是熵(entropy,熵是一种不纯度度量准则),
也就是熵的变化值.
而
文章来源: wenyusuran.blog.csdn.net,作者:文宇肃然,版权归原作者所有,如需转载,请联系作者。
原文链接:wenyusuran.blog.csdn.net/article/details/40857455
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
评论(0)