贝叶斯算法实例

举报
俺想吃蜂蜜 发表于 2022/04/12 18:50:33 2022/04/12
【摘要】 朴素贝叶斯分类是一种十分简单的分类算法,说它十分简单是因为它的解决思路非常简单。即对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。而朴素贝叶斯(Native Bayes)算法是基于贝叶斯定理和特征条件独立假设的分类算法。朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:...

朴素贝叶斯分类是一种十分简单的分类算法,说它十分简单是因为它的解决思路非常简单。即对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

而朴素贝叶斯(Native Bayes)算法是基于贝叶斯定理和特征条件独立假设的分类算法。朴素贝叶斯分类是一种十分简单的分类算法,叫它朴素贝叶斯分类是因为这种方法的思想真的很朴素,朴素贝叶斯的思想基础是这样的:对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。

下面我们就用一道题来解释贝叶斯算法的应用

给定如下表所示事务数据库,待分类样本为X={age≤30,income=”high”,student=”yes”,credit_rating=”Excellent”},使用朴素贝叶斯方法对X进行分类。

TID age income student credit_rating buys_computer
1 ≤30 High No Fair No
2 ≤30 High No Excellent No
3 31~40 High No Fair Yes
4 >40 Medium No Fair Yes
5 >40 Low Yes Fair Yes
6 >40 Low Yes Excellent No
7 31~40 Low Yes Excellent Yes
8 ≤30 Medium No Fair No
------ ------ ---------
9 ≤30 Low Yes Fair Yes
10 >40 Medium Yes Fair Yes
11 ≤30 Medium Yes Excellent Yes
12 31~40 Medium No Excellent Yes
13 31~40 High Yes Fair Yes
14 >40 Medium No Excellent No

由事务数据库可知,类标号属性 buys_computer具有两个不同的值{yes,no},设buys_computer=”yes ”为类别C1,buys_computer= ” no ” 为类别C2

由贝叶斯定理可知,我们需要最大化P(X/Ci)P(Ci),i=1,2。

每个类的先验概率P(Ci)根据样本数据库可得:

P(C1)=9/14=0.643

P(C2)=5/14=0.357

由事务数据库可知,类标号属性buys_computer具有两个不同的值{yes,no},设buys_computer=”yes”为类别C1,buys_computer=”no”为类别C2
由贝叶斯定理可知,我们需要最大化P(X/Ci)P(Ci),i=1,2。

每个类的先验概率P(Ci)根据样本数据库可得:

P(C1)=9/14=0.643

P(C2)=5/14=0.357  
待分类样本X中各属性条件独立,故:P(X/C1)=P(age≤30/C1)P(income=”high”/C1)P(student=”yes”/C1)P(credit_rating=”Excellent”/C1)=(2/9)(2/9)(6/9)*(3/9)=0.011

P(X/C2)=P(age=≤30/C2)P(income=”high”/C2)P(student=”yes”/C2)P(credit_rating=”Excellent”/C2)=(3/5)(2/5)(1/5)*(3/5)=0.0288

P(X/C1)P(C1)=0.0110.643=0.0071

P(X/C2)P(C2)=0.02880.357=0.0103

X属于C2的概率大于C1,故X应归为C2类。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。