数据中台推荐系统入门(二):两种经典的推荐算法

举报
格图洛书 发表于 2021/11/19 00:01:57 2021/11/19
【摘要】 前言 所谓“物以类聚,人以群分”,基于用户的协同过滤算法就是基于这个原理来实现的。   你可能听过“啤酒与尿不湿”的故事:通过对一家超市的销售数据分析发现,有很多人在购买啤酒的同时又购买了尿不湿,这就是基于物品的协同过滤算法的案例。   读完本文你可以了解这两种算法的原理,并学会如何实现这两种算法。 &n...

前言

所谓“物以类聚,人以群分”,基于用户的协同过滤算法就是基于这个原理来实现的。

 

你可能听过“啤酒与尿不湿”的故事:通过对一家超市的销售数据分析发现,有很多人在购买啤酒的同时又购买了尿不湿,这就是基于物品的协同过滤算法的案例。

 

读完本文你可以了解这两种算法的原理,并学会如何实现这两种算法。

 

1 基于用户的协同过滤算法

 

我们在生活中如何找到自己喜欢的商品呢?比如你想买一件衬衫,可能会看一下或者问一下周围的朋友都穿什么样的衬衫,在朋友的影响下,你有很大概率会到线上网店或者线下实体店中看一下这件衬衫。在推荐系统中,这就是一种向用户推荐感兴趣商品的方法,叫基于用户的协同过滤算法。

 

根据这个思路,我们可以看出基于用户的协同过滤算法主要分为2个步骤。

 

(1)找到和目标用户兴趣相似的用户。

 

这一步的关键是找到和目标用户相似的用户。我们看一下,在电商产品中如何通过用户的数据找到和目标用户相似的用户。

 

比如用户的下单数据为:①用户A下单购买了商品a、b、c;②用户B下单购买了商品a;③用户C下单购买了商品a、b。

 

通过这个简单的例子,我们可以看出,A和C的相似度显然高于A和B的相似度,因为A和C同时购买了商品a、b,而A和B仅仅同时购买了商品a。

 

那么如何通过算法计算用户A、B、C之间的相似度呢?这里可以引入余弦相似度公式。

 

文章来源: wenyusuran.blog.csdn.net,作者:文宇肃然,版权归原作者所有,如需转载,请联系作者。

原文链接:wenyusuran.blog.csdn.net/article/details/116355129

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。