《深度学习之图像识别:核心技术与案例实战》 ——3.1.4 ImageNet数据集

举报
华章计算机 发表于 2020/02/23 13:20:57 2020/02/23
【摘要】 本节书摘来自华章计算机《深度学习之图像识别:核心技术与案例实战》 ——书中第3章,第3.1.4节,作者是言有三  。

3.1.4  ImageNet数据集

  ImageNet数据集地址为:http://www.image-net.org/,2009年由李飞飞实验室发布。

  ImageNet数据集是李飞飞实验室主导的一个项目,目标是构建一个计算机视觉研究的大型数据库,关键词从WordNet中选取。完整的ImageNet数据集有1400多万幅图片,涵盖2万多个类别的标注与超过百万的边界框标注,每一个类别大约有500~1000张图片,标注采用了亚马逊的众包平台,这个平台之后被用于构建各种数据集。

  2009年CVPR会议室李飞飞实验室正式发布了ImageNet数据集,此后从2010年到2017年共举办了8届Large Scale Visual Recognition Challenge,即业界熟知的ILSVRC比赛,包括图像分类、目标检测和目标定位单元。

  在最开始的时候,ImageNet是一个连经费都申请不到的整理数据的项目,为很多专注于算法研究的学术人员“不耻”,但科技公司的竞赛热情及数据集史无前例的多样性,让陷身于过拟合的算法从数据集本身看到了新的出路,之后极大地推进了计算机视觉任务的发展。

  由于类别多,ImageNet不可能像MNIST数据集整理过程中那样简单地将所有图片分成互不相干的10类,而是采用了WordNet中树形结构的组织方式。比如从哺乳动物关键词开始整理,然后不断细分为有胎盘的哺乳动物→肉食动物→犬科动物→狗→工作中的狗→哈士奇。

  ImageNet竞赛使用的是ImageNet完整数据集的一个子类,包括1000类,其中大部分是动物。在深度学习任务中,我们经常会使用ImageNet预训练的模型,不过大部分人未必了解ImageNet数据集的构建过程和历史,有兴趣的读者可以去查阅详细了解。


【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。