高斯yolov3
【摘要】 Gaussian YOLOv3
https://github.com/jwchoi384/Gaussian_YOLOv3
预测特征图的属性
RGB3通道图像被输入到yolov3网络。 检测结果在三个不同的尺度下输出,包括目标的坐标位置、目标是正样本还是负样本、目标属于某一类置信度。 对于每个比例尺分支,在每个网格单元中预测三个结果(每个比例尺三个锚)。 结合三个尺度的结...
Gaussian YOLOv3
https://github.com/jwchoi384/Gaussian_YOLOv3
预测特征图的属性
RGB3通道图像被输入到yolov3网络。
检测结果在三个不同的尺度下输出,包括目标的坐标位置、目标是正样本还是负样本、目标属于某一类置信度。
对于每个比例尺分支,在每个网格单元中预测三个结果(每个比例尺三个锚)。
结合三个尺度的结果,进行非最大抑制(NMS),输出最终的测试结果。
如yolov3的输出所述,目标类别有一个概率值,但目标框只有一个位置,没有概率值,即无法从结果预测当前目标帧的可靠性。在此基础上,本文采用高斯模型对网络输出进行建模,在不改变yolov3的结构和计算量的情况下,可以输出每个预测帧的可靠性,使算法的整体性能提高了3个点。地图。
高斯 YOLOv3
Gaussian yolov3通过增加网络的输出和改善网络的损耗函数来实现预测帧可靠性的输出,如下图所示:
拟议算法的预测框中的组件
由此我们可以看出,与原始yolov3在坐标预测中输出4维不同,高斯yolov3在边界框的坐标预测输出中包含8维。
这八个维度相当于预测框的中心坐标和长宽,以及相应预测框的不确定性。以目标盒的位置为高斯分布的均值,相应的不确定度为方差,将手指建模为四个高斯分布。如下面的对准代码所示,高斯yolov3通过预测每个坐标位置的不确定性来提高最终预测prob值的精度。
由于高斯yolov3的输出被调整,相应的损失函数的计算将相应地被调整。与原yolov3相比,只调整了预测帧坐标位置的回归策略。如下面的代码比较所示,当原始yolov3执行box回归时,由于网络预测输出是坐标本身,因此在计算梯度时使用均方误差。由于高斯yolov3输出均值和方差,因此在计算梯度时结合高斯分布策略。
文章来源: blog.csdn.net,作者:网奇,版权归原作者所有,如需转载,请联系作者。
原文链接:blog.csdn.net/jacke121/article/details/102789433
【版权声明】本文为华为云社区用户转载文章,如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱:
cloudbbs@huaweicloud.com
- 点赞
- 收藏
- 关注作者
作者其他文章
评论(0)