推荐系统论文解读:Hete-CF

举报
北纬30度 发表于 2021/09/01 11:42:19 2021/09/01
【摘要】 本文是对基于异质关系的社交协同过滤算法Hete-CF论文的解读

概述

协同过滤算法在推荐系统中应用非常广泛。然而,它常受到数据稀疏和冷启动问题的困扰。随着社交媒体的日益普及,这些问题或许可以通过使用基于社交的推荐来解决。 基于社交的推荐是一个新兴的研究领域,它利用社会信息来缓解数据稀疏性和冷启动问题,研究表明基于社交的推荐算法可以有效地提高推荐性能。 然而,现有的算法很少考虑在一个社交网络中使用多种类型的关系。这篇论文研究了基于社交关系的异构社会网络推荐算法,提出了一种基于异质关系的社交协同过滤算法Hete-CF。 与现有方法不同的是,Hete-CF可以有效地利用异构社会网络中的多种关系。此外,Hete-CF是一种通用的方法,可以用于任意的社交网络,包括基于事件的社交网络、基于位置的社交网络等等。

介绍

基于社交的推荐方法利用社交信息来提高推荐效果。 为了更好地利用社会信息,论文研究了异构社会网络上的协同过滤方法。 与以往仅使用部分社交信息模型不同的是,作者使用三种类型的关系,不仅是用户-用户关系和商品-商品关系,还包括用户-商品关系。

图中显示了一个简单的异构网络(Bibliographic network),从图中可以看出,该网络中存在三种类型的对象:
作者、论文和会议。还需要注意的是,网络中存在不止一个关系。为了在异构网络中利用这些关系,可以使用元路径表示每种类型的关系。 元路径是异构信息网络中表示关系的有效方法 。

“ co-author ”关系可以表示为一个元路径 “Author-Paper-Author”

“ co-conference “关系可以表示为 “Author-Paper-Conf.-Paper-Author”

论文提到的异质社交网络(HSNs)可以看作是包含社会信息的HINs,例如书目网络或Facebook关系网络。HSN、HIN、EBSN和LBSN的关系如图所示。

从图中可以看出,LBSN和EBSN是HSN的特例,HSN是HIN的特例。在本研究中,我们考虑了包括LBSN在内的各种hsn, EBSN和其他与社会信息相关的HIN。

异质社交网络可以被表示为G=<O,E,W>,O是一系列的社交实体如人物、作者。E是任意两个社交实体之间的连接集合。W是连接上的权重。元路径用来表示异构信息网络中的不同关系。

方法

首先要对用户-用户、用户-物品、物品-物品进行建模。当向用户推荐项目时,可以利用用户之间的关系来提高推荐性能。这是因为,类似的用户在特定范围的物品上可能有类似的方向。

1.用户之间的关系建模

如:作者Tom和Peter关注相似的研究课题,并且都对人工智能感兴趣,如果Tom经常在AAAI会议上发表论文,Peter也很有可能在AAAI上发表论文。

论文使用图正则化对上述常识建模,目标函数如下所示 :

min U , A k = 0 N A α k i = 0 n j = 0 n S A k ( i , j ) U i U j F 2 \min_{U,A}\sum^{N_{A}}_{k=0}\alpha_{k}\sum^{n}_{i=0}\sum^{n}_{j=0}S^{k}_{A}(i,j)\parallel U_{i}-U_{j}\parallel^{2}_{F}

2.建模物品之间的关系

通过引入项目之间的关系,可以提高推荐性能,即用户可能对类似的商品感兴趣。
文章使用图正则化对这个常识建模:

min V , B k = 0 N B β k i = 0 n j = 0 n S B k ( i , j ) V i V j F 2 \min_{V,B}\sum^{N_{B}}_{k=0}\beta_{k}\sum^{n}_{i=0}\sum^{n}_{j=0}S^{k}_{B}(i,j)\parallel V_{i}-V_{j}\parallel^{2}_{F}

3.建模用户和物品之间的关系

在异构的社交网络中,用户和项目之间还有许多其他类型的关系,这些关系可以用来进一步提高推荐性能。 与历史用户物品评级一样,这些关系也存在于用户和物品之间。 通过协同过滤方法对这种关系建模,模型如下所示:

min U , V , W k = 0 N W ω k i = 0 n j = 0 m ( U i T V j R i , j ) 2 \min_{U,V,W}\sum^{N_{W}}_{k=0}\omega_{k}\sum^{n}_{i=0}\sum^{m}_{j=0}(U^{T}_{i}V_{j}-\mathbb{R}_{i,j})^{2}

4.最终模型

将上面三个子模型结合在一起可得到基于异构社交网络的推荐模型 。

min U , V , A , B , W i = 0 n j = 0 m ( U i T V j R i , j ) 2 + min U , A k = 0 N A α k i = 0 n j = 0 n S A k ( i , j ) U i U j F 2 + min V , B k = 0 N B β k i = 0 n j = 0 n S B k ( i , j ) V i V j F 2 + μ k = 0 N W ω k i = 0 n j = 0 m ( U i T V j R i , j ) 2 + λ ( U F 2 + V F 2 + A F 2 + B F 2 + W F 2 ) \min_{U,V,A,B,W}\sum^{n}_{i=0}\sum^{m}_{j=0}(U^{T}_{i}V_{j}-\mathbb{R}_{i,j})^{2}+\min_{U,A}\sum^{N_{A}}_{k=0}\alpha_{k}\sum^{n}_{i=0}\sum^{n}_{j=0}S^{k}_{A}(i,j)\parallel U_{i}-U_{j}\parallel^{2}_{F}+\min_{V,B}\sum^{N_{B}}_{k=0}\beta_{k}\sum^{n}_{i=0}\sum^{n}_{j=0}S^{k}_{B}(i,j)\parallel V_{i}-V_{j}\parallel^{2}_{F}+\mu\sum^{N_{W}}_{k=0}\omega_{k}\sum^{n}_{i=0}\sum^{m}_{j=0}(U^{T}_{i}V_{j}-\mathbb{R}_{i,j})^{2}+\lambda(\parallel U\parallel^{2}_{F}+\parallel V\parallel^{2}_{F}+\parallel A\parallel^{2}_{F}+\parallel B\parallel^{2}_{F}+\parallel W\parallel^{2}_{F})

模型的第一项为协同过滤模块,第二第三项是用户-用户,物品-物品的关系, 模型的第四个项是用户-项目关系,最后一项是平滑项。

模型的学习方法是两步迭代法,包含预测评级向量U, V和每个元路径A, B, W的权值相互增强。在第一步中,确定权重向量A, B, W,并学习最佳预测评级向量U, V。在第二步中,拟合预测的评级向量U V,并学习最佳权值向量A,B,W。

实验结果

从这些结果可以看出随着训练数据的增加,Hete-CF性能变得更好。这是因为更多的训练数据可以提供更多的信息,更重要的是,该模型可以避免过拟合。 在DBLP数据集中当特征向量的维数d = 5时,Hete-CF性能达到最优。

小结

  1. 论文提出了一种通用的推荐算法(Hete-CF)的异构社交网络。该算法可用于多种类型的异构社交网络,包括LBSN和EBSN等。

  2. 在协同过滤算法的基础上加入异构信息网络,以增强在社交网络中关系的表达。

【版权声明】本文为华为云社区用户原创内容,未经允许不得转载,如需转载请自行联系原作者进行授权。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。