推荐引擎:基于余弦相似度书籍推荐Python实现

举报
彭世瑜 发表于 2021/08/14 01:18:32 2021/08/14
【摘要】 # -*- coding: utf-8 -*- # @Date : 2019-02-14 # @Author : Peng Shiyu from copy import deepcopy import numpy as np from sklearn.feature_extraction import DictVectorizer from sklearn.me...
# -*- coding: utf-8 -*-

# @Date : 2019-02-14
# @Author  : Peng Shiyu

from copy import deepcopy

import numpy as np
from sklearn.feature_extraction import DictVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# 数据准备:{书名: 评分}
# user = {"红楼梦", "西游记", "水浒传", "三国演义"}

user1 = {"红楼梦": 4, "西游记": 3}
user2 = {"红楼梦": 5, "西游记": 6, "水浒传": 3}
user3 = {"红楼梦": 4, "西游记": 3, "三国演义": 5}
user4 = {"西游记": 4, "三国演义": 5}

data = [ user1, user2, user3, user4
]

# 特征提取
dict_vectorizer = DictVectorizer(dtype=np.int32, sparse=False)
result = dict_vectorizer.fit_transform(data)
books = dict_vectorizer.get_feature_names()
print(dict_vectorizer.get_feature_names())
print(result)

# 余弦相似度矩阵
user_similarity = cosine_similarity(result)
print(user_similarity)

for user_id, user_looked in enumerate(data): user_suggest = user_similarity[user_id].tolist() # 找到与之相似度最高的两个人 user_suggest_bak = deepcopy(user_suggest) user_suggest_bak.sort(reverse=True) max_similar = user_suggest_bak[1: 3] print(max_similar) max_index = list(map(user_suggest.index, max_similar)) print(max_index) suggest = {} for index, user in enumerate([data[i] for i in max_index]): for key, value in user.items(): if key not in user_looked: suggest[key] = user_suggest[index] * value print(suggest)
"""
['三国演义', '水浒传', '红楼梦', '西游记']
[[0 0 4 3]
 [0 3 5 6]
 [5 0 4 3]
 [5 0 0 4]]
 
[[1. 0.90837374 0.70710678 0.37481703]
 [0.90837374 1. 0.64231723 0.44799204]
 [0.70710678 0.64231723 1. 0.81719329]
 [0.37481703 0.44799204 0.81719329 1. ]]
 
[0.9083737430941391, 0.7071067811865475]
{'水浒传': 3.0, '三国演义': 4.541868715470695}

[0.9083737430941391, 0.6423172335936725]
{'三国演义': 4.999999999999999}

[0.8171932929538644, 0.7071067811865475]
{}

[0.8171932929538644, 0.44799203576793445]
{'红楼梦': 2.2399601788396724, '水浒传': 1.3439761073038032}

"""

  
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 45
  • 46
  • 47
  • 48
  • 49
  • 50
  • 51
  • 52
  • 53
  • 54
  • 55
  • 56
  • 57
  • 58
  • 59
  • 60
  • 61
  • 62
  • 63
  • 64
  • 65
  • 66
  • 67
  • 68
  • 69
  • 70
  • 71
  • 72
  • 73
  • 74
  • 75
  • 76
  • 77
  • 78
  • 79
  • 80

参考:
推荐算法和机器学习系列 - 协同过滤推荐算法和余弦相似性算法

文章来源: pengshiyu.blog.csdn.net,作者:彭世瑜,版权归原作者所有,如需转载,请联系作者。

原文链接:pengshiyu.blog.csdn.net/article/details/87626697

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。