无监督学习(一)概述

举报
星火燎原 发表于 2020/10/31 11:29:57 2020/10/31
【摘要】 数据标注难一直是限制人工智能模型开发的重要环节,一种有效的解决方案就是无监督学习,从数据本身中挖掘固定的结构和模式。本文对无监督学习进行概括性的介绍,并展示了一些无监督学习的研究内容和方向。

1. 无监督学习应用场景:在大量无标注数据中自动挖掘潜在的结构和模式。


2. 典型应用场景-数据分析:通过无监督聚类的方式对不同用户进行聚类,在每个类内进行广告推荐,商品推荐;通过无监督方式对数据进行降维,加速计算。


3. 典型应用场景 - 计算机视觉:特征表示学习,无监督异常检测,图像生成,无监督域迁移。


4. 特征表示学习 - 研究内容

5. 特征表示学习 - 自监督学习技术


6. 无监督异常检测 - 研究内容及常用技术


7. 无监督学习总结

(1)特征表示学习:

a. 找到合适的辅助任务(pretext)对于自监督学习时最需要解决的问题。

b. 数据和资源越多,自监督预训练的效果更好(Bert, MoCo, SimCLR)。

c. 自监督学习直接和具体任务的结合(task-related)是一个可探索的方向。

(2)无监督异常检测:

a. 提升图像生成质量,对差异计算效果更好。

b. 如何保证重构出正常图,是无监督异常检测的难点。

c. 异常判定策略(原图与重构正常图的对比)对异常检测影响较大。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。