关于语义分割的一些模型
语义分割:
就是机器自动分割并识别图像中存在的内容以及位置(通过查找属于它的所有像素)。
常见的模型:
U-Net :
1.网络结构:
2.模型解释:
“编码-解码”结构的典型代表。
网络是一个经典的全卷积网络(即网络中没有全连接操作)。网络的输入是一张 572*572 的边缘经过镜像操作的图片,网络的左侧(红色虚线)是由卷积和Max Pooling构成的一系列降采样操作(称为压缩路径)。压缩路径由4个block组成,每个block使用了3个有效卷积和1个Max Pooling降采样,每次降采样之后Feature Map的个数乘2,因此有了图中所示的Feature Map尺寸变化。最终得到了尺寸为 32*32的Feature Map。
网络的右侧部分(绿色虚线)在论文中叫做扩展路径(expansive path)。同样由4个block组成,每个block开始之前通过反卷积将Feature Map的尺寸乘2,同时将其个数减半(最后一层略有不同),然后和左侧对称的压缩路径的Feature Map合并,由于左侧压缩路径和右侧扩展路径的Feature Map的尺寸不一样,U-Net是通过将压缩路径的Feature Map裁剪到和扩展路径相同尺寸的Feature Map进行归一化的(即图1中左侧虚线部分)。扩展路径的卷积操作依旧使用的是有效卷积操作,最终得到的Feature Map的尺寸是 388*388。由于该任务是一个二分类任务,所以网络有两个输出Feature Map。
Deeplab v3+
1.网络结构
2.模型解释
(1)基于DeepLab v3,将原结构作为编码器,另外加入一个解码器,由此将空间金字塔池化结构的多尺度特征捕捉能力和编码器-解码器结构处理边界细节的能力相结合。
(2)将Xception中的深度可分离卷积应用到空洞空间金字塔池化(ASPP)和解码模块中,进一步提升速度和精度。
(3)该算法可以通过调整空洞卷积来控制特征分辨率,从而在精度和速度之间灵活取舍。
Dense Decoder Shortcut Connections for Single
1.网络结构
2.模型解释
基于级联架构与特征级远程跳跃连接。该编码器结合了ResNeXt残余构建块的结构,并采用重复构建块的策略,该构件块聚集了具有相同拓扑的一组变换。
该解码器具有一种新颖的架构,由块组成,这些架构包括(i)捕获上下文信息,(ii)生成语义特征,以及(iii)实现不同输出分辨率之间的融合。
- 点赞
- 收藏
- 关注作者
评论(0)