- 微信
- 微博
  
  分享文章到微博
- 复制链接
  
  复制链接到剪贴板

《深度学习之图像识别核心技术与案例实战》—3.1.4 ImageNet数据集

华章计算机发表于 2019/06/02 00:18:43 2019/06/02

【摘要】本书摘自《深度学习之图像识别核心技术与案例实战》一书中的第3章，第3.1.4节，作者是言有三。

3.1.4 ImageNet数据集

　　ImageNet数据集地址为：http://www.image-net.org/，2009年由李飞飞实验室发布。

　　ImageNet数据集是李飞飞实验室主导的一个项目，目标是构建一个计算机视觉研究的大型数据库，关键词从WordNet中选取。完整的ImageNet数据集有1400多万幅图片，涵盖2万多个类别的标注与超过百万的边界框标注，每一个类别大约有500～1000张图片，标注采用了亚马逊的众包平台，这个平台之后被用于构建各种数据集。

　　2009年CVPR会议室李飞飞实验室正式发布了ImageNet数据集，此后从2010年到2017年共举办了8届Large Scale Visual Recognition Challenge，即业界熟知的ILSVRC比赛，包括图像分类、目标检测和目标定位单元。

　　在最开始的时候，ImageNet是一个连经费都申请不到的整理数据的项目，为很多专注于算法研究的学术人员“不耻”，但科技公司的竞赛热情及数据集史无前例的多样性，让陷身于过拟合的算法从数据集本身看到了新的出路，之后极大地推进了计算机视觉任务的发展。

　　由于类别多，ImageNet不可能像MNIST数据集整理过程中那样简单地将所有图片分成互不相干的10类，而是采用了WordNet中树形结构的组织方式。比如从哺乳动物关键词开始整理，然后不断细分为有胎盘的哺乳动物→肉食动物→犬科动物→狗→工作中的狗→哈士奇。

　　ImageNet竞赛使用的是ImageNet完整数据集的一个子类，包括1000类，其中大部分是动物。在深度学习任务中，我们经常会使用ImageNet预训练的模型，不过大部分人未必了解ImageNet数据集的构建过程和历史，有兴趣的读者可以去查阅详细了解。

点赞
收藏
关注作者

0/1000

抱歉，系统识别当前为高风险访问，暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称，即可参与社区互动！

*长度不超过10个汉字或20个英文字符，设置后3个月内不可修改。

确认取消

加入云驻计划，成为创作者

华为云周边好礼
免费体验产品
特殊身份标识
线下官方门票
内部专家零距离
与10000+优质创作者共同成长

立即加入

《深度学习之图像识别核心技术与案例实战》—3.1.4 ImageNet数据集

3.1.4 ImageNet数据集

全部回复

设置昵称

关于作者

目录

加入云驻计划，成为创作者

《深度学习之图像识别核心技术与案例实战》—3.1.4 ImageNet数据集

3.1.4 ImageNet数据集

全部回复

设置昵称

关于作者

目录

热门推荐查看更多

相关文章

加入云驻计划，成为创作者

相关产品