Cityscapes数据集(智能驾驶场景的语义分割)

举报
一颗小树x 发表于 2021/10/24 16:52:56 2021/10/24
【摘要】 ​前言面向智能驾驶(辅助驾驶、自动驾驶)场景下的语义分割任务,由于非结构化场景的复杂性,是一个非常具有挑战性的任务,所以有许多研究者和研究机构公开了很多相关的数据集推动语义分割领域的发展。本文主要介绍Cityscapes数据集。一、简介Cityscapes 数据集上专门针对城市街道场景的数据集,整个数据集由 50 个不同 城市的街景组成,数据集包括了 5000 张精准标注的图片和 20000...

前言

面向智能驾驶(辅助驾驶、自动驾驶)场景下的语义分割任务,由于非结构化场景的复杂性,是一个非常具有挑战性的任务,所以有许多研究者和研究机构公开了很多相关的数据集推动语义分割领域的发展。本文主要介绍Cityscapes数据集。

一、简介

Cityscapes 数据集上专门针对城市街道场景的数据集,整个数据集由 50 个不同 城市的街景组成,数据集包括了 5000 张精准标注的图片和 20000 张粗略标注的图片。

其中精准标注的图片主要用于强监督学习,可分为训练集、验证集和测试集,而粗略标 注的图片主要用于弱监督语义分割算法的训练与测试。在 Cityscapes 数据集中通常使用 19 种常用的类别用于类别分割精度的评估。

官网地址:Cityscapes Dataset – Semantic Understanding of Urban Street Scenes


二、5000张精准标注

示例1: 


示例2:

 详细的示例图片可以去官网看看:Examples – Cityscapes Dataset


三、20000 张粗略标注

示例1:

   详细的示例图片可以去官网看看:Examples – Cityscapes Dataset


四、类别定义

Group Classes
flat road · sidewalk · parking+ · rail track+
human person* · rider*
vehicle car* · truck* · bus* · on rails* · motorcycle* · bicycle* · caravan*+ · trailer*+
construction building · wall · fence · guard rail+ · bridge+ · tunnel+
object pole · pole group+ · traffic sign · traffic light
nature vegetation · terrain
sky sky
void ground+ · dynamic+ · static+


五、模型评估服务

官网提供了一个基准套件和一个评估服务器,这样开发者就可以上传模型结果,并获得关于不同任务(像素级、 实例级和全景语义标记以及3d 车辆检测)的排名。


5.1 像素级语义标注

这个是在不考虑更高级别的对象实例或边界信息的情况下,预测图像的每像素语义标签。

截至2021/10/24号,前几位的模型效果排名如下。


5.2 实例级语义标注

这个专注于同时检测对象并对其进行分割。这是对传统对象检测和像素级语义标记(因为每个实例都被视为单独的标签)的扩展。因此,需要算法来提供一组场景中交通参与者的检测,每个检测都与置信度分数和每个实例的分割掩码相关联。

截至2021/10/24号,前几位的模型效果排名如下。


5.3 全景语义标注

它将像素级和实例级语义标记结合在一个称为“全景分割”的任务中。截至2021/10/24号,前几位的模型效果排名如下。

5.4 3D车辆检测

这个重点是车辆的 3D 对象检测,以估计其 3D 参数,如方向和位置。评估类汽车、卡车、公共汽车、火车、摩托车和自行车的对象。每个对象都由一个非模态 2D 边界框以及一个 9 自由度 3D 边界框描述:中心位置、尺寸和方向。

截至2021/10/24号,前几位的模型效果排名如下。

大家可以看看那个排名靠前的模型,是否有公开论文,或是否代码开源,进行参考学习;当然自己搭建的模型也可以上传评估一下,看看效果和排名。


六、下载数据集

官网下载地址:Login – Cityscapes Dataset 注意:这是要注册一个账号,才能下载的;然后来到如下页面:

 查找相关的数据集下载就可以了

 比如下载gtFine_trainvaltest.zip (241MB) [md5] 训练集和验证集的精细注释(3475 个带注释的图像)和测试集(1525 个图像)的虚拟注释。

官方的处理脚本地址:https://github.com/mcordts/cityscapesScripts

如果我们使用此数据集,请引用此出版物

M. Cordts, M. Omran, S. Ramos, T. Rehfeld, M. Enzweiler, R. Benenson, U. Franke, S. Roth, and B. Schiele, “The Cityscapes Dataset for Semantic Urban Scene Understanding,” in Proc. of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016. [Bibtex]

main paper · supplemental · arxiv · CVF


本文直供大家参考和学习,谢谢。

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。