推荐系统论文解读:Hete-CF
概述
协同过滤算法在推荐系统中应用非常广泛。然而,它常受到数据稀疏和冷启动问题的困扰。随着社交媒体的日益普及,这些问题或许可以通过使用基于社交的推荐来解决。 基于社交的推荐是一个新兴的研究领域,它利用社会信息来缓解数据稀疏性和冷启动问题,研究表明基于社交的推荐算法可以有效地提高推荐性能。 然而,现有的算法很少考虑在一个社交网络中使用多种类型的关系。这篇论文研究了基于社交关系的异构社会网络推荐算法,提出了一种基于异质关系的社交协同过滤算法Hete-CF。 与现有方法不同的是,Hete-CF可以有效地利用异构社会网络中的多种关系。此外,Hete-CF是一种通用的方法,可以用于任意的社交网络,包括基于事件的社交网络、基于位置的社交网络等等。
介绍
基于社交的推荐方法利用社交信息来提高推荐效果。 为了更好地利用社会信息,论文研究了异构社会网络上的协同过滤方法。 与以往仅使用部分社交信息模型不同的是,作者使用三种类型的关系,不仅是用户-用户关系和商品-商品关系,还包括用户-商品关系。
图中显示了一个简单的异构网络(Bibliographic network),从图中可以看出,该网络中存在三种类型的对象:
作者、论文和会议。还需要注意的是,网络中存在不止一个关系。为了在异构网络中利用这些关系,可以使用元路径表示每种类型的关系。 元路径是异构信息网络中表示关系的有效方法 。
“ co-author ”关系可以表示为一个元路径 “Author-Paper-Author”
“ co-conference “关系可以表示为 “Author-Paper-Conf.-Paper-Author”
论文提到的异质社交网络(HSNs)可以看作是包含社会信息的HINs,例如书目网络或Facebook关系网络。HSN、HIN、EBSN和LBSN的关系如图所示。
从图中可以看出,LBSN和EBSN是HSN的特例,HSN是HIN的特例。在本研究中,我们考虑了包括LBSN在内的各种hsn, EBSN和其他与社会信息相关的HIN。
异质社交网络可以被表示为G=<O,E,W>,O是一系列的社交实体如人物、作者。E是任意两个社交实体之间的连接集合。W是连接上的权重。元路径用来表示异构信息网络中的不同关系。
方法
首先要对用户-用户、用户-物品、物品-物品进行建模。当向用户推荐项目时,可以利用用户之间的关系来提高推荐性能。这是因为,类似的用户在特定范围的物品上可能有类似的方向。
1.用户之间的关系建模
如:作者Tom和Peter关注相似的研究课题,并且都对人工智能感兴趣,如果Tom经常在AAAI会议上发表论文,Peter也很有可能在AAAI上发表论文。
论文使用图正则化对上述常识建模,目标函数如下所示 :
2.建模物品之间的关系
通过引入项目之间的关系,可以提高推荐性能,即用户可能对类似的商品感兴趣。
文章使用图正则化对这个常识建模:
3.建模用户和物品之间的关系
在异构的社交网络中,用户和项目之间还有许多其他类型的关系,这些关系可以用来进一步提高推荐性能。 与历史用户物品评级一样,这些关系也存在于用户和物品之间。 通过协同过滤方法对这种关系建模,模型如下所示:
4.最终模型
将上面三个子模型结合在一起可得到基于异构社交网络的推荐模型 。
模型的第一项为协同过滤模块,第二第三项是用户-用户,物品-物品的关系, 模型的第四个项是用户-项目关系,最后一项是平滑项。
模型的学习方法是两步迭代法,包含预测评级向量U, V和每个元路径A, B, W的权值相互增强。在第一步中,确定权重向量A, B, W,并学习最佳预测评级向量U, V。在第二步中,拟合预测的评级向量U V,并学习最佳权值向量A,B,W。
实验结果
从这些结果可以看出随着训练数据的增加,Hete-CF性能变得更好。这是因为更多的训练数据可以提供更多的信息,更重要的是,该模型可以避免过拟合。 在DBLP数据集中当特征向量的维数d = 5时,Hete-CF性能达到最优。
小结
-
论文提出了一种通用的推荐算法(Hete-CF)的异构社交网络。该算法可用于多种类型的异构社交网络,包括LBSN和EBSN等。
-
在协同过滤算法的基础上加入异构信息网络,以增强在社交网络中关系的表达。
- 点赞
- 收藏
- 关注作者
评论(0)