- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

美图个性化推荐的实践与探索

Tracy 发表于 2019/10/15 14:54:37 2019/10/15

【摘要】互联网技术将我们带入了信息爆炸的时代，面对海量的信息，一方面用户难以迅速发现自己感兴趣的信息，另一方面长尾信息得不到曝光。为了解决这些问题，个性化推荐系统应运而生。美图拥有海量用户的同时积累了海量图片与视频，通过推荐系统有效建立了用户与内容的连接，大幅度提升产品的用户体验。总览美图个性化推荐主要应用于美拍APP，应用场景如下：场景一：美拍直播，实时的在线个性化排序业务；场景二：美拍热门（即美...

互联网技术将我们带入了信息爆炸的时代，面对海量的信息，一方面用户难以迅速发现自己感兴趣的信息，另一方面长尾信息得不到曝光。为了解决这些问题，个性化推荐系统应运而生。美图拥有海量用户的同时积累了海量图片与视频，通过推荐系统有效建立了用户与内容的连接，大幅度提升产品的用户体验。

总览

美图个性化推荐主要应用于美拍APP，应用场景如下：

场景一：美拍直播，实时的在线个性化排序业务；
场景二：美拍热门（即美拍首页），典型的Feed流产品，用户可在热门Feed流中不断翻页滚动，探索和消费自己可能感兴趣的内容；
场景三：播放详情页下的“猜你喜欢”模块，用于推荐相似视频。

个性化推荐的目标是连接用户与内容、提升用户体验和优化内容生态。为了实现以上目标，算法需要理解内容，了解平台上可用于推荐的内容；同时也要理解用户，了解用户的兴趣爱好，从而进行精准推荐。

理解内容

理解内容，即内容的特征提取。美拍APP的内容是短视频，其特征可分为四部分：

基础特征，即视频的时长、分辨率、标签等基础属性；
视觉特征，即通过视觉算法，对人物的性别、颜值、年龄、身高，对视频的场景、对象等进行识别；
文本特征，美拍短视频有封面文字、标题、评论等文本信息，可以通过这些文本信息进行文本挖掘，提取一些关键字、topic、情感极性等文本特征；
交互特征，是用户与内容进行行为交互的产物，用户可以对某些内容进行点赞、评论、分享、播放等行为，通过对这些交互数据进行统计分析得到交互特征。

理解用户

对内容有一定理解之后，则要进一步理解用户，从而连接用户与内容。理解用户就是我们常说的用户画像建设，建设用户画像需要了解用户的自然属性，如用户的性别、年龄、所在城市；社会属性，如职业、婚姻状况等；以及最重要的兴趣属性，除了了解用户在平台上的兴趣和偏好，也要尽可能去探索用户在平台之外的兴趣爱好（打游戏、逛淘宝等）。

个性化推荐探索

内容多样性

多样性、准确性以及新颖性是衡量推荐系统效果非常重要的三个指标。同时最大化这三个指标从而给用户带来惊喜，使得用户在平台上留存，是推荐系统的一个终极目标。但在实际情况下，这三个指标往往需要权衡取舍，例如在大多数情况下，提升准确性的同时，推荐多样性指标可能会降低。因此，我们将问题简化，对多目标问题进行重新建模，在保证一定的多样性和新颖性约束的前提下最大化推荐准确性。

那么，如何保证推荐多样性呢？首先要定义什么内容是一样的，从而知道什么内容是不一样的。我们可以通过运营对视频打标签、通过视觉算法进行视觉分类，而上述几种方法都依赖先验的类目体系，往往无法精确匹配用户时刻变化的细粒度兴趣点。一个UGC平台，其重要特性之一就是内容形态快速更新，有各种各样的创意会发展成小众类别，再从小众类别迅速发展成一个新类别，那么这种基于经验知的有监督方法是无法及时响应变化的，因此考虑利用用户行为序列对内容聚类。

内容聚类

在基于用户行为序列的内容聚类中，假设用户对于兴趣点会产生其行为序列，假设某个用户喜欢小鲜肉和舞蹈，那么基于这个兴趣点，他便会观看较多小鲜肉跳舞的视频。这个问题可以类比文本领域的Topic Model问题，当作者写文章时，需要先确定文章主题，再基于主题确定文章中使用到的词。

而对用户兴趣进行建模，我们采用LDA的方法将用户类比为一篇文章，用户行为序列里的内容类比为文章里的词，那么可以对内容直接利用LDA模型进行聚类，从而匹配到用户兴趣。基于这样的假设，可以采用word2Vec对内容生成向量再进行聚类，也可以基于LDA的深化版本DSSM模型来对内容生成向量。如图19右侧所示，是DSSM方法的网络结构图。

展望

未来美图希望能够挖掘更多的场景，为用户提供更多的个性化服务，从而全面提升用户的产品体验。我们也希望能够通过个性化的迭代与内容生态变化进行推演，从而更全面地优化内容生态，同时通过建设更深层次的模型进行精准推荐，从有监督的学习模型训练向强化学习的方法转变，进而预估推荐算法的期望收益，大幅度提升用户体验。

本文转载自异步社区。

原文链接

https://www.epubit.com/articleDetails?id=Nf4c9b656-1afc-4fee-a396-ccc10759f8ee

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

美图个性化推荐的实践与探索

总览

理解内容

理解用户

推荐流程

召回阶段

预估阶段

排序阶段

OFFLINE

NEARLINE

ONLINE

个性化推荐探索

推荐时效性

召回时效性

预估时效性

内容冷启动

UCB

Thompson采样

内容多样性

内容聚类

展望

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

美图个性化推荐的实践与探索

总览

理解内容

理解用户

推荐流程

召回阶段

预估阶段

排序阶段

OFFLINE

NEARLINE

ONLINE

个性化推荐探索

推荐时效性

召回时效性

预估时效性

内容冷启动

UCB

Thompson采样

内容多样性

内容聚类

展望

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品