《深度学习之图像识别:核心技术与案例实战》 ——3.1.4 ImageNet数据集
3.1.4 ImageNet数据集
ImageNet数据集地址为:http://www.image-net.org/,2009年由李飞飞实验室发布。
ImageNet数据集是李飞飞实验室主导的一个项目,目标是构建一个计算机视觉研究的大型数据库,关键词从WordNet中选取。完整的ImageNet数据集有1400多万幅图片,涵盖2万多个类别的标注与超过百万的边界框标注,每一个类别大约有500~1000张图片,标注采用了亚马逊的众包平台,这个平台之后被用于构建各种数据集。
2009年CVPR会议室李飞飞实验室正式发布了ImageNet数据集,此后从2010年到2017年共举办了8届Large Scale Visual Recognition Challenge,即业界熟知的ILSVRC比赛,包括图像分类、目标检测和目标定位单元。
在最开始的时候,ImageNet是一个连经费都申请不到的整理数据的项目,为很多专注于算法研究的学术人员“不耻”,但科技公司的竞赛热情及数据集史无前例的多样性,让陷身于过拟合的算法从数据集本身看到了新的出路,之后极大地推进了计算机视觉任务的发展。
由于类别多,ImageNet不可能像MNIST数据集整理过程中那样简单地将所有图片分成互不相干的10类,而是采用了WordNet中树形结构的组织方式。比如从哺乳动物关键词开始整理,然后不断细分为有胎盘的哺乳动物→肉食动物→犬科动物→狗→工作中的狗→哈士奇。
ImageNet竞赛使用的是ImageNet完整数据集的一个子类,包括1000类,其中大部分是动物。在深度学习任务中,我们经常会使用ImageNet预训练的模型,不过大部分人未必了解ImageNet数据集的构建过程和历史,有兴趣的读者可以去查阅详细了解。
- 点赞
- 收藏
- 关注作者
评论(0)