618又一次被掏空?电商的推荐系统究竟采用了什么黑科技?

举报
iMaster NAIE官方 发表于 2021/08/28 10:28:47 2021/08/28
【摘要】 一年一度的618电商购物狂欢节又双叒叕要来了。菊厂小王打开某电商APP,准备买款手机送给女朋友。电商APP的后台好像早就知晓小王的喜好一般,贴心地为他奉上“专属”商品页面。▲ 小王的购物车历来都是外行看热闹(剁手),内行看门道(技术)。这种帮助过滤信息,预测用户对物品的行为和偏好的技术正是电商后台推荐系统。推荐系统基于图数据库技术,通过设计各种节点(用户、商品、店铺……)和关系(收藏、购买、...

一年一度的618电商购物狂欢节又双叒叕要来了。菊厂小王打开某电商APP,准备买款手机送给女朋友。电商APP的后台好像早就知晓小王的喜好一般,贴心地为他奉上“专属”商品页面。1.jpg

▲ 小王的购物车

历来都是外行看热闹(剁手),内行看门道(技术)。

这种帮助过滤信息,预测用户对物品的行为和偏好的技术正是电商后台推荐系统。

推荐系统基于图数据库技术,通过设计各种节点(用户、商品、店铺……)和关系(收藏、购买、点赞、加购物车……),从而准确分析判断出用户的喜好,给出用户可能感兴趣的商品。

2.jpg

▲基于相似用户模型的推荐

比如小王本来的目的是买A品牌手机的,但是系统不仅给他推荐了B品牌手机,还推荐了其他电子产品。这导致小王的购物预算增加了1倍。

图数据库到底是什么呢?

什么是图?

1738年瑞典科学家欧拉创立了图论,认为图的基本元素是点和边。每个节点代表一个实体,每个关系(边)代表两个实体的关联方式。

3.jpg

什么是图数据模型?
图模型描述的是——如何存、采用什么实现方式来存取数据。图数据基于图数据模型,才能存储到图数据库中,最终落实为具体的数据文件。

常用的图模型有三种:属性图、超图和三元组

属性图:这也是目前使用最多的一种图模型,实体和关系也会拥有各自的属性,比如人可以有“性别”和“职业”。

4.jpg

超图:一个关系可以关联任意数量的节点。超图其实可以转换成属性图,但属性图不能转成超图。

5.jpg

三元组:三元组存储需要借助W3C制定的资源描述框架(RDF)建模,将三元组元素分别存储,使用SPARQL作为查询语言,方便进行知识推理和数据关联。RDF 在设计上的主要特点是易于发布和分享数据,但不支持实体或关系拥有属性。


6.jpg

什么是数据库?
数据库是长期存储在计算机中的有组织的、可共享的数据的大集合。数据库中的数据按照一定的数据模型进行组织、描述和存储,可以被各种用户共享。

目前国内厂商里排名最为靠前是华为高斯数据库和阿里的PolarDB。Gauss (高斯)数据库是一个开源数据库,基于 PostgreSQL9.2 开发; 阿里云自研的云原生关系型数据库PolarDB连续多年稳定支撑天猫双11,在系统负载增加了135倍情况下依然保持稳定。

7.jpg

什么是图数据库?
图数据库并非指存储图片的数据库,而是以图结构存储数据的在线数据库管理系统。

它是非关系型数据库中的一种特定的适用于多跳分析、关系挖掘、推荐引擎等场景的数据库。相较于更适合随机访问且要求数据强一致性的关系型数据库,非关系型数据库统一适用于结构型不太强并且在性能、可扩展性、数据量上有更高要求的场景。

8.jpg

数据来源:人工智能之图数据库报告(2020年第4期)

目前业界图数据库主要有2种:
1.原生图:以图模型格式存储数据,即顶点和边。原生图数据库使用免邻接索引处理CRUD操作,业界比较流行的是Neo4j和TigerGraph。

2.非原生图:将图数据存储成关系型数据模型、RDF三元组或键值对,在内存层,将其转换成图模型来模拟图的CRUD操作,业界比较流行的是JanusGraph(Titan)、NebulaGraph。

9.jpg

从DBEngines.com中图数据库的排行榜来看,最出名的仍然是老牌图数据库Neo4j,其应用厂商已经达到110+多个,涉及情报分析、金融欺诈、知识图谱、推荐引擎等多种场景;其次是Microsoft Azure Cosmos DB及ArangoDB。

另从DBEngines.com统计报告也显示,数据库行业近些年来发展最迅速的就是图数据库,并且其仍在继续上升,远远领先于其他数据库的发展。

10.jpg

数据来源:DB-Engines官网

图数据库与知识图谱
我们经常提到的知识图谱,就是以图数据库作为存储引擎,对海量信息进行智能化处理,形成大规模的知识库并进而支撑业务应用。它也是图数据库关联最为紧密,场景最广泛的应用方向。

据Gartner发布的2020年数据与分析领域的十大技术趋势[2]表示,到2022年,知识图谱技术实现100%的快速增长,到2023年,知识图谱技术将促进全球30%的企业机构决策过程的快速情景化。除此以外,知识图谱与AI结合,将对未来自然灾害和其他危机的识别、预测和规划发挥关键作用。
数据来源:https://neo4j.com

看完全文,相信聪明的你对电商的推荐系统及其它的底层技术——图数据库已经有所了解了。

简而言之, 推荐系统的核心就是基于图数据库技术,建立用户模型和推荐对象模型,再通过相应的推荐算法进行计算筛选,找到用户可能感兴趣的推荐对象,然后推荐给用户。你get到了吗?

参考资料

[1]摘自数据观入驻自媒体—刘鹏看未来,转载请注明来源中国大数据产业观察网www.cbdio.com

[2]https://www.gartner.com/cn/newsroom/press-releases/gartner_2020_

[3]https://zhuanlan.zhihu.com/p/25179862

[4]人工智能之图数据库报告(2020年第4期)

[5]费马科技《知识图谱和图数据库》

[6]张帜《Neo4j权威指南》

[7] alg 《究竟什么是图数据库,它有哪些应用场景?》


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。