- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

相似度计算方法：余弦相似度

北山啦发表于 2021/04/22 00:50:20 2021/04/22

【摘要】相似度计算方法：余弦相似度计算用户相似度和用户对未知物品的可能评分基于用户的协同过滤算法主要包括两个步骤。 (1) 找到和目标用户兴趣相似的用户集合。 (2) 找到这个集合中的用户喜欢的，且目标用户没有听说过的物品推荐给目标用户。例如现在有A、B、C、D四个用户，分别对a、b、c、d、e五个物品表达了自己喜好程度（通过评分高低来表现自己的偏好...

相似度计算方法：余弦相似度

计算用户相似度和用户对未知物品的可能评分

基于用户的协同过滤算法主要包括两个步骤。

(1) 找到和目标用户兴趣相似的用户集合。

(2) 找到这个集合中的用户喜欢的，且目标用户没有听说过的物品推荐给目标用户。

例如现在有A、B、C、D四个用户，分别对a、b、c、d、e五个物品表达了自己喜好程度（通过评分高低来表现自己的偏好程度高低），现在要为C用户推荐物品：

构建用户物品评分表

相似度 计算

计算用户相似度的方法很多，这里选用余弦相似度

余弦相似度原理

用向量空间中的两个向量夹角的余弦值作为衡量两个个体间差异大小的度量，值越接近1，就说明夹角角度越接近0°，也就是两个向量越相似，就叫做余弦相似

给定用户u和用户v，令N(u)表示用户u曾经有过正反馈的物品集合，令N(v)为用户v曾经有过正反馈的物品集合。

可以看出D用户与C用户相似度最大。

3、计算推荐结果

用户C评分的物品是b和e，下面计算用户C对物品a,c,d的偏好程度:

参考代码：


  
   
    
     
    
    
     
      import math
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      class UserCF:
     
    
   
    
     
    
    
     
          def __init__(self):
     
    
   
    
     
    
    
     
              self.user_score_dict = self.initUserScore()
     
    
   
    
     
    
    
     
              self.users_sim = self.UserSimilarity()
     
    
   
    
     
    
    
     
      
     
    
   
    
     
    
    
     
          # 初始化用户评分数据
     
    
   
    
     
    
    
     
          def initUserScore(self):
     
    
   
    
     
    
    
     
              user_score_dict = {"A": {"a": 3.0, "b": 4.0, "c": 0.0, "d": 3.5, "e": 0.0},
     
    
   
    
     
    
    
     
                                 "B": {"a": 4.0, "b": 0.0, "c": 4.5, "d": 0.0, "e": 3.5},
     
    
   
    
     
    
    
     
                                 "C": {"a": 0.0, "b": 3.5, "c": 0.0, "d": 0., "e": 3.0},
     
    
   
    
     
    
    
     
                                 "D": {"a": 0.0, "b": 4.0, "c": 0.0, "d": 3.50, "e": 3.0}}
     
    
   
    
     
    
    
     
              return user_score_dict
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
        
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
       # 计算用户之间的相似度,采用的是遍历每一个用户进行计算
     
    
   
    
     
    
    
     
          def UserSimilarity(self):
     
    
   
    
     
    
    
     
              W = dict()
     
    
   
    
     
    
    
     
              for u in self.user_score_dict.keys():
     
    
   
    
     
    
    
     
                  W.setdefault(u,{})
     
    
   
    
     
    
    
     
                  for v in self.user_score_dict.keys():
     
    
   
    
     
    
    
     
                      if u == v:
     
    
   
    
     
    
    
     
                          continue
     
    
   
    
     
    
    
     
                      u_set = set( [key for key in self.user_score_dict[u].keys() if self.user_score_dict[u][key] > 0])
     
    
   
    
     
    
    
     
                      v_set = set( [key for key in self.user_score_dict[v].keys() if self.user_score_dict[v][key] > 0])
     
    
   
    
     
    
    
     
                      W[u][v] = float(len(u_set & v_set)) / math.sqrt(len(u_set) * len(v_set))
     
    
   
    
     
    
    
     
              return W 
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          # 预测用户对item的评分
     
    
   
    
     
    
    
     
          def preUserItemScore(self, userA, item):
     
    
   
    
     
    
    
     
              score = 0.0
     
    
   
    
     
    
    
     
              for user in self.users_sim[userA].keys():
     
    
   
    
     
    
    
     
                  if user != userA:
     
    
   
    
     
    
    
     
                      score += self.users_sim[userA][user] * self.user_score_dict[user][item]
     
    
   
    
     
    
    
     
              return score
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
          # 为用户推荐物品
     
    
   
    
     
    
    
     
          def recommend(self, userA):
     
    
   
    
     
    
    
     
              # 计算userA 未评分item的可能评分
     
    
   
    
     
    
    
     
              user_item_score_dict = dict()
     
    
   
    
     
    
    
     
              for item in self.user_score_dict[userA].keys():
     
    
   
    
     
    
    
     
                  if self.user_score_dict[userA][item] <= 0:
     
    
   
    
     
    
    
     
                      user_item_score_dict[item] = self.preUserItemScore(userA, item)
     
    
   
    
     
    
    
     
              return user_item_score_dict
     
    
   
    
     
    
    
      
     
    
   
    
     
    
    
     
      if __name__ == "__main__":
     
    
   
    
     
    
    
     
          ub = UserCF()
     
    
   
    
     
    
    
     
          print(ub.recommend("C"))

spyder实验结果：

{'a': 2.8577380332470415, 'c': 1.8371173070873839, 'd': 4.286607049870562}

文章来源: blog.csdn.net，作者：北山啦，版权归原作者所有，如需转载，请联系作者。

原文链接：blog.csdn.net/qq_45176548/article/details/115890407

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

相似度计算方法：余弦相似度

相似度计算方法：余弦相似度

构建用户物品评分表

相似度 计算

余弦相似度原理

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

相似度计算方法：余弦相似度

相似度计算方法：余弦相似度

构建用户物品评分表

相似度计算

余弦相似度原理

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品