关于语义分割的一些模型

举报
韬光养晦 发表于 2020/07/16 20:35:51 2020/07/16
【摘要】 就是机器自动分割并识别图像中存在的内容以及位置(通过查找属于它的所有像素)。

image.png

 语义分割:

    就是机器自动分割并识别图像中存在的内容以及位置(通过查找属于它的所有像素)。


常见的模型:

U-Net :

1.网络结构:

image.png

2.模型解释:

“编码-解码”结构的典型代表。

网络是一个经典的全卷积网络(即网络中没有全连接操作)。网络的输入是一张 572*572 的边缘经过镜像操作的图片,网络的左侧(红色虚线)是由卷积和Max Pooling构成的一系列降采样操作(称为压缩路径)。压缩路径由4个block组成,每个block使用了3个有效卷积和1个Max Pooling降采样,每次降采样之后Feature Map的个数乘2,因此有了图中所示的Feature Map尺寸变化。最终得到了尺寸为 32*32的Feature Map。

网络的右侧部分(绿色虚线)在论文中叫做扩展路径(expansive path)。同样由4个block组成,每个block开始之前通过反卷积将Feature Map的尺寸乘2,同时将其个数减半(最后一层略有不同),然后和左侧对称的压缩路径的Feature Map合并,由于左侧压缩路径和右侧扩展路径的Feature Map的尺寸不一样,U-Net是通过将压缩路径的Feature Map裁剪到和扩展路径相同尺寸的Feature Map进行归一化的(即图1中左侧虚线部分)。扩展路径的卷积操作依旧使用的是有效卷积操作,最终得到的Feature Map的尺寸是 388*388。由于该任务是一个二分类任务,所以网络有两个输出Feature Map。


Deeplab v3+

1.网络结构

image.png

2.模型解释

  • (1)基于DeepLab v3,将原结构作为编码器,另外加入一个解码器,由此将空间金字塔池化结构的多尺度特征捕捉能力和编码器-解码器结构处理边界细节的能力相结合。

  • (2)将Xception中的深度可分离卷积应用到空洞空间金字塔池化(ASPP)和解码模块中,进一步提升速度和精度。

  • (3)该算法可以通过调整空洞卷积来控制特征分辨率,从而在精度和速度之间灵活取舍。



Dense Decoder Shortcut Connections for Single

1.网络结构


image.png

2.模型解释

基于级联架构与特征级远程跳跃连接。该编码器结合了ResNeXt残余构建块的结构,并采用重复构建块的策略,该构件块聚集了具有相同拓扑的一组变换。

该解码器具有一种新颖的架构,由块组成,这些架构包括(i)捕获上下文信息,(ii)生成语义特征,以及(iii)实现不同输出分辨率之间的融合。

【版权声明】本文为华为云社区用户翻译文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容, 举报邮箱:cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。