YOLOv8独家原创改进:FPN涨点篇 |多级特征融合金字塔(HS-FPN),助力小目标检测| 2024年最新论文

举报
AI小怪兽 发表于 2024/02/05 15:21:04 2024/02/05
【摘要】 高层筛选特征金字塔网络(HS-FPN),能够刷选出大小目标,增强模型表达不同尺度特征的能力,助力小目标检测

💡💡💡本文独家改进:高层筛选特征金字塔网络(HS-FPN),能够刷选出大小目标,增强模型表达不同尺度特征的能力,助力小目标检测

💡💡💡BCCD医学数据集实现暴力涨点。

1.MFDS-DETR原理介绍

论文: https://arxiv.org/pdf/2401.00926.pdf

摘要:在标准的医院血液检测中,传统的过程需要医生手动分离白细胞。用显微镜观察病人血液的显微图像。然后将这些分离的白细胞通过自动白细胞分类器进行分类,以确定不同的比例和体积血液样本中存在的白细胞类型,有助于疾病诊断。这种方法不是但由于以下因素,它也有很高的出错倾向作为图像质量和环境条件,这可能潜在地导致不正确的后续分类与误诊。当代白细胞检测方法表现出局限性。在处理具有较少白细胞特征的图像和不同尺度之间的差异时白细胞,在大多数情况下导致不满意的结果。为了解决这些问题,本文提出了一种创新的白细胞检测方法:多层次特征融合与变形。自我注意力检测(MFDS-DETR)。为了解决白细胞规模差异的问题,我们设计了高级筛选特征融合金字塔(HS-FPN),实现多级融合。这个模型使用高级特征作为权重以经由信道关注模块过滤低级特征信息,以及然后将筛选后的信息与高级特征合并,从而增强模型的特征表达能力。此外,我们通过合并A来解决白细胞特征缺乏的问题。在编码器中使用多尺度可变形自注意模块,在解码器中使用自注意和交叉可变形注意机制,有助于全局特征的提取。白细胞特征图。通过与其他前沿白细胞检测模型的比较,证实了所提出的MFDSDETR方法的有效性、优越性和可推广性使用私有WBCDD、公共LISC和BCCD数据集。

该架构名为MFDS-DETR(多级特征融合与可变形自注意力DETR),旨在解决检测尺度不同且在图像中可能特征有限的白细胞的挑战。

以下是MFDS-DETR架构四个部分的分解:

骨干网:这是从输入图像中提取特征的基础网络。通常,像ResNet或VGG这样的预训练卷积神经网络(CNN)被用作骨干网。

高层筛选特征金字塔网络(HS-FPN):这个组件旨在处理不同白细胞之间的尺度差异问题。它很可能是一个特征金字塔网络(FPN),创建了一个多尺度特征层次结构,允许模型检测不同大小的白细胞。高层特征用于筛选(或权衡)低层特征,然后与高层特征融合,以增强模型表达不同尺度特征的能力。

编码器:编码器负责对骨干网和HS-FPN提取的特征进行编码。它可能结合多尺度可变形自注意力模块,以进一步增强特征提取过程。可变形卷积网络可以自适应地调整其感受野,以关注图像中更多信息丰富的区域,这对于检测形状和大小变化的对象特别有用。

解码器:解码器获取编码后的特征,并使用它们来预测图像中白细胞的位置和类别。它可能使用自注意力和交叉可变形注意力机制,通过考虑特征图中的全局上下文来细化检测。

HS-FPN的结构如图2所示,包括两个主要组成部分:1)特征选择模块;2)特征融合模块。

为了解决白细胞数据集固有的多尺度挑战,我们开发了基于层次尺度的特征金字塔网络(HS-FPN)来完成多尺度特征融合。这使得该模型能够捕获更全面的白细胞特征信息。HS-FPN的结构如图2所示。HS-FPN主要由两个部分组成:(1)特征选择模块。(2)特征融合模块。最初,不同尺度的特征图在特征选择模块中经过筛选过程。随后,通过选择性特征融合(Selective feature Fusion, SFF)机制,将这些特征映射中的高层和低层信息协同集成。这种融合产生的特征具有丰富的语义内容,这有助于检测白细胞显微图像中的细微特征,从而增强模型的检测能力。进一步阐述这种SFF机制及其对模型性能的影响将在随后的烧蚀研究部分提供。

 2.如何将HS-FPN将入到YOLOv8

核心代码:

import torch
import torch.nn as nn



class HSFPN(nn.Module):
    def __init__(self, in_planes, ratio = 4, flag=True):
        super(HSFPN, self).__init__()
        self.avg_pool = nn.AdaptiveAvgPool2d(1)
        self.max_pool = nn.AdaptiveMaxPool2d(1)

        self.conv1 = nn.Conv2d(in_planes, in_planes // ratio, 1, bias=False)
        self.relu = nn.ReLU()
        self.conv2 = nn.Conv2d(in_planes // ratio, in_planes, 1, bias=False)
        self.flag = flag
        self.sigmoid = nn.Sigmoid()

        nn.init.xavier_uniform_(self.conv1.weight)
        nn.init.xavier_uniform_(self.conv2.weight)

    def forward(self, x):
        avg_out = self.conv2(self.relu(self.conv1(self.avg_pool(x))))
        max_out = self.conv2(self.relu(self.conv1(self.max_pool(x))))
        out = avg_out + max_out
        return self.sigmoid(out) * x if self.flag else self.sigmoid(out)

原文链接:

https://blog.csdn.net/m0_63774211/article/details/136039825

【版权声明】本文为华为云社区用户原创内容,转载时必须标注文章的来源(华为云社区)、文章链接、文章作者等基本信息, 否则作者和本社区有权追究责任。如果您发现本社区中有涉嫌抄袭的内容,欢迎发送邮件进行举报,并提供相关证据,一经查实,本社区将立刻删除涉嫌侵权内容,举报邮箱: cloudbbs@huaweicloud.com
  • 点赞
  • 收藏
  • 关注作者

评论(0

0/1000
抱歉,系统识别当前为高风险访问,暂不支持该操作

全部回复

上滑加载中

设置昵称

在此一键设置昵称,即可参与社区互动!

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。

*长度不超过10个汉字或20个英文字符,设置后3个月内不可修改。