华为云EI夺得图像识别领域“世界杯”

举报
四号路口 发表于 2020/06/17 20:10:01 2020/06/17
【摘要】 近日,在第四届图像识别竞赛WebVision中,华为云EI 以82.97%的准确率击败来自全世界的94支参赛队伍获得冠军,领先第二名近1个百分点。

近日,在第四届图像识别竞赛WebVision中,华为云EI 以82.97%的准确率击败来自全世界的94支参赛队伍获得冠军!领先第二名近1个百分点!

image.png



WebVision 竞赛由苏黎世联邦理工(ETH)、Google Research、卡耐基梅隆大学(CMU)等共同组织,是目前图像识别领域最权威的竞赛之一,被业界誉为人工智能“世界杯”,接棒曾经推动计算机物体分类准确率超过人类的ImageNet 竞赛。

image.png

WebVision竞赛要求参赛的AI模型将1600万+张图片精准分类到5000个类目中。大赛所用数据集直接从互联网爬取,没有经过人工标注。因此数据中含有很多噪音,且数据类别的数量存在着极大不平衡,相较于 ImageNet,WebVision 难度提高许多,同时也更加贴近于实际应用中的场景。

WebVision竞赛展示了人工智能技术发展的另外一种可能性:基于弱监督学习,深度学习可以不再以人工标注数据为基础,人工智能有望真正摆脱“人工”。

image.png

此次竞赛中,华为云EI基于ModelArts训练大规模图像分类模型,基于先进的分布式训练方法,可以缩短超大规模数据集的训练时间。利用伴随图像数据的文本描述信息,融合文本与视觉多模态特征,通过训练过程中的动态评估识别并剔除大量噪声数据,并进一步通过知识蒸馏降低噪声对模型训练的影响,最终在完全没有人工标注的情况下,从互联网上自动爬取的大规模数据集上进行学习,训练得到准确率82.97%高精度模型。

华为云EI在本次比赛中运用的图像识别技术,可广泛用于通用物品识别、图像/视频标签等领域。近十年来计算机视觉取得的进展离不开大量人工标注的数据集,但由于人工标注需要较高的成本,几乎不太可能构建包罗万象的超级数据集。互联网上存在几乎取之不尽的无标注图像数据,利用这些数据的周边文本等信息作为带噪声的弱标注数据进行学习,能够在很大程度上降低图像识别对人工标注的依赖。

华为云EI在视觉研究领域有着丰富的技术积累,在6 月14日-19 日举办的CVPR2020(国际计算机视觉和模式识别大会) 中,华为贡献论文34 篇,涵盖迁移学习、半监督学习、网络架构搜索、模型算子优化、知识蒸馏、对抗样本生成等前沿领域。展示了华为在计算机视觉领域强大的人才储备、科研底蕴和创新能力。

华为云EI在行业应用上亦有丰富的商用实践经验。目前,华为云EI内容审核、人脸识别、图像搜索、视频分析等服务已经成功应用于互联网、媒资、园区、物流、工业等行业。华为云还将图像识别技术应用于天文、气象等领域。2019年基于华为云图像识别能力,在上海天文台与国际组织SKA(平方公里阵列射电望远镜) 合作的项目中,科学家们仅用10.02 秒即完成了对 20 万颗星体的识别,同时可以准确地对某一类星体进行定位,传统方式完成如此大量的星体识别工作需要 169 天时间。


【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。