【学习语义分割】SegNet网络学习

举报
韬光养晦 发表于 2020/07/17 12:54:51 2020/07/17
【摘要】 引用:https://www.youtube.com/watch?v=CxanE_W46ts参考:http://mi.eng.cam.ac.uk/projects/segnet/tutorial.html 1.SegNet的介绍:在语义分割领域中应用编码器-解码器(encoder-decoder)的结构。encode(编码器):使用池化层逐渐缩减输入数据的空间维度。decoder(解码器):...

image.png

引用:https://www.youtube.com/watch?v=CxanE_W46ts

参考:http://mi.eng.cam.ac.uk/projects/segnet/tutorial.html 

1.SegNet的介绍:

在语义分割领域中应用编码器-解码器(encoder-decoder)的结构。

encode(编码器):使用池化层逐渐缩减输入数据的空间维度。

decoder(解码器):通过反卷积层等网络层逐渐恢复目标的细节和空间维度。

2.网络结构:

image.png


3.encoder-decoder的结构的解释:

image.png

(1)encode:在给定输入图像后,通过神经网络学习得到输入图像的特征图谱

                      在编码器处,执行卷积和最大池化

                      在进行2×2最大池化时,存储相应的最大池化索引(位置)

(2)decoder:在编码器提供特征图后,逐步实现每个像素的类别标注

                      在解码器处,执行上采样和卷积。最后,每个像素送到 softmax 分类器

                      在上采样期间,调用相应编码器层处的最大池化索引以进行上采样

                      最后,使用 K 类 softmax 分类器来预测每个像素的类别

image.png

使用最大池化的索引进行上采样

4.SegNet与FCN的对比:

SegNet和FCN思路比较相似,不同的是SegNet在FCN的基础上增加了解码器。

解码器使用从编码器传输的较大池化索引(位置)对其输入进行非线性上采样,从而使得上采样不需要学习,生成稀疏特征映射。然后,使用可训练的卷积核进行卷积操作,生成密集的特征图。最后的解码器输出特征映射被送入soft-max分类器进行像素级分类。 

image.png

图引用知乎https://zhuanlan.zhihu.com/p/36525939

5.SegNet效果图:

SegNet通过监督学习来学习预测像素级类标签。

(1)输入图像:

image.png

(2)SegNet基本分割:

image.png

(3)SegNet细分:

image.png

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。