【数据挖掘】关联规则挖掘 Apriori 算法 ( 置信度 | 置信度示例 )

举报
韩曙亮 发表于 2022/01/10 23:44:40 2022/01/10
【摘要】 文章目录 一、 置信度二、 置信度 示例 参考博客 : 【数据挖掘】关联规则挖掘 Apriori 算法 ( 关联规则简介 | 数据集 与 事物 Transaction 概念 | 项 Ite...

参考博客 :





一、 置信度



关联规则 X ⇒ Y \rm X \Rightarrow Y XY 的置信度 ,

表示 数据集 D \rm D D 中包含 X \rm X X 项集的事物 , 同时有多大可能性包含 Y \rm Y Y 项集 ,

等于 项集 X ∪ Y \rm X \cup Y XY 的支持度 与 项集 X \rm X X 的支持度 比值 ;

公式为 :

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)} confidence(XY)=support(X)support(XY)





二、 置信度 示例



示例 : 数据集 D \rm D D 为 :

事物编号 事物 ( 商品 )
001 001 001 奶粉 , 莴苣
002 002 002 莴苣 , 尿布 , 啤酒 , 甜菜
003 003 003 奶粉 , 尿布 , 啤酒 , 橙汁
004 004 004 奶粉 , 莴苣 , 尿布 , 啤酒
005 005 005 奶粉 , 莴苣 , 尿布 , 橙汁


求关联规则 尿 布 ⇒ 啤 酒 \rm 尿布 \Rightarrow 啤酒 尿 的置信度 ? ? ?


根据上述公式

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)} confidence(XY)=support(X)support(XY)

计算 X ⇒ Y \rm X \Rightarrow Y XY 置信度 ;



1 . 计算 s u p p o r t ( X ∪ Y ) \rm support (X \cup Y) support(XY) 支持度 :

S u p p o r t ( X ⇒ Y ) = S u p p o r t ( X ∪ Y ) = c o u n t ( X ∪ Y ) c o u n t ( D ) \rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)} Support(XY)=Support(XY)=count(D)count(XY)

s u p p o r t ( X ∪ Y ) \rm support (X \cup Y) support(XY) 指的是 数据集 D \rm D D 中含有项集 X ∪ Y \rm X \cup Y XY 的事务个数 ;

含有 X ∪ Y = { 尿 布 , 啤 酒 } \rm X \cup Y=\{ 尿布 , 啤酒 \} XY={尿,} 项集的事务有 事务 2 \rm 2 2 , 事务 3 3 3 , 事务 4 4 4 , 得出 :

c o u n t ( X ∪ Y ) = 3 \rm count (X \cup Y) = 3 count(XY)=3


c o u n t ( D ) \rm count(D) count(D) 指的是 数据集 D \rm D D 的事务总数 ; 得出

c o u n t ( D ) = 5 \rm count(D) = 5 count(D)=5


计算支持度结果 :

S u p p o r t ( X ⇒ Y ) = S u p p o r t ( X ∪ Y ) = c o u n t ( X ∪ Y ) c o u n t ( D ) \rm Support (X \Rightarrow Y) = Support (X \cup Y) = \cfrac{count (X \cup Y)}{count (D)} Support(XY)=Support(XY)=count(D)count(XY)

S u p p o r t ( X ) = S u p p o r t ( X ∪ Y ) = 3 5 \rm Support (X) = Support (X \cup Y) = \cfrac{3}{5} Support(X)=Support(XY)=53



2 . 计算 S u p p o r t ( X ) \rm Support (X) Support(X) 支持度 , 项集 X = { 奶 粉 } \rm X=\{ 奶粉 \} X={}


根据上述公式 S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)} Support(X)=count(D)count(X) 计算支持度 ;


c o u n t ( X ) \rm count (X) count(X) 指的是 数据集 D \rm D D 中含有项集 X \rm X X 的事务个数 ;

含有 X = { 奶 粉 } \rm X=\{ 奶粉 \} X={} 项集的事务有 事务 1 \rm 1 1 , 事务 3 3 3 , 事务 4 4 4 , 事务 5 5 5 , 得出 :

c o u n t ( X ) = 4 \rm count (X) = 4 count(X)=4


c o u n t ( D ) \rm count(D) count(D) 指的是 数据集 D \rm D D 的事务总数 ; 得出

c o u n t ( D ) = 5 \rm count(D) = 5 count(D)=5


则计算支持度 :

S u p p o r t ( X ) = c o u n t ( X ) c o u n t ( D ) \rm Support (X) = \cfrac{count (X)}{count (D)} Support(X)=count(D)count(X)

S u p p o r t ( X ) = 4 5 \rm Support (X) = \cfrac{4}{5} Support(X)=54



3 . 求最终置信度

c o n f i d e n c e ( X ⇒ Y ) = s u p p o r t ( X ∪ Y ) s u p p o r t ( X ) \rm confidence (X \Rightarrow Y) = \cfrac{support (X \cup Y)}{support (X)} confidence(XY)=support(X)support(XY)

c o n f i d e n c e ( X ⇒ Y ) = 3 5 4 5 = 3 4 \rm confidence (X \Rightarrow Y) = \cfrac{ \dfrac{3}{5}}{\dfrac{4}{5}} = \cfrac{3}{4} confidence(XY)=5453=43

最终置信度为 3 4 \cfrac{3}{4} 43

文章来源: hanshuliang.blog.csdn.net,作者:韩曙亮,版权归原作者所有,如需转载,请联系作者。

原文链接:hanshuliang.blog.csdn.net/article/details/109679468

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。