【推荐系统】基于MovieLens数据集实现的协同过滤算法

举报
毛利 发表于 2021/07/15 00:17:29 2021/07/15
【摘要】 利用用户行为数据 如何了解一个人呢? 通过用户留下的文字和行为了解用户兴趣和需求。 实现个性化推荐的最理想情况是用户在注册的时候主动告知其喜欢什么。 3个缺点: 现在的自然语言理解技术很难理解用户用来描述兴趣的自然语言; 用户的兴趣是不断变化的; 很多时候用户并不知道自己喜欢什么,或者很难用语言描述。 基于用户行为分析的推荐算法是个性化推荐系统的重...

利用用户行为数据

如何了解一个人呢?

通过用户留下的文字和行为了解用户兴趣和需求。

实现个性化推荐的最理想情况是用户在注册的时候主动告知其喜欢什么。

3个缺点:

  1. 现在的自然语言理解技术很难理解用户用来描述兴趣的自然语言;
  2. 用户的兴趣是不断变化的;
  3. 很多时候用户并不知道自己喜欢什么,或者很难用语言描述。

基于用户行为分析的推荐算法是个性化推荐系统的重要算法,学术界一般将这种类型的算法称为协同过滤1算法。
用户行为数据在网站上最简单的存在形式就是日志。

  • 原始日志(raw log)

  • 会话日志(session log)

    将多种原始日志按照用户行为汇总,每个会话表示一次用户行为和对应的服务。

  • 展示日志(impression log)

    搜索引擎和搜索广告系统服务为每次查询生成的,记录了查询和返回结果。

  • 点击日志(click log)

    用户点击了某个返回结果的点击信息。

一个并行程序会周期性地归并展示日志和点击日志,得到的会话日志中每个消息是一个用户提交的查询、得到的结果以及点击。

推荐系统和电子商务网站也会汇总原始日志生成描述用户行为的会话日志。会话日志通常存储在分布式数据仓库中,这些日志记录了用户的各种行为。

用户行为在个性化推荐系统中一般分为两种:

文章来源: maoli.blog.csdn.net,作者:刘润森!,版权归原作者所有,如需转载,请联系作者。

原文链接:maoli.blog.csdn.net/article/details/115759683

【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。