首页 > 其他分享 >YOLOv8改进 - 注意力篇 - 引入SK网络注意力机制

YOLOv8改进 - 注意力篇 - 引入SK网络注意力机制

时间:2024-09-26 23:22:55浏览次数:13  
标签:conv nn self YOLOv8 SK 注意力 channel

一、本文介绍

作为入门性篇章,这里介绍了SK网络注意力在YOLOv8中的使用。包含SK原理分析,SK的代码、SK的使用方法、以及添加以后的yaml文件及运行记录。

二、SK原理分析

SK官方论文地址:SK注意力文章

SK注意力机制:SK网络中的神经元可以捕获具有不同比例的目标对象,实验验证了神经元根据输入自适应地调整其感受野大小的能力。其SK模块的原理结构如下图所示。该方法由三个部分组成:Split,Fuse,Select。

Split就是一个multi-branch的操作,用不同的卷积核进行卷积得到不同的特征;

Fuse部分就是用SE的结构获取通道注意力的矩阵(N个卷积核就可以得到N个注意力矩阵,这步操作对所有的特征参数共享),这样就可以得到不同kernel经过SE之后的特征;

Select操作就是将这几个特征进行相加。

相关代码:

SK注意力的代码,如下。

from torch.nn import init
from collections import OrderedDict

class SKAttention(nn.Module):

    def __init__(self, channel=512, kernels=[1, 3, 5, 7], reduction=16, group=1, L=32):
        super().__init__()
        self.d = max(L, channel // reduction)
        self.convs = nn.ModuleList([])
        for k in kernels:
            self.convs.append(
                nn.Sequential(OrderedDict([
                    ('conv', nn.Conv2d(channel, channel, kernel_size=k, padding=k // 2, groups=group)),
                    ('bn', nn.BatchNorm2d(channel)),
                    ('relu', nn.ReLU())
                ]))
            )
        self.fc = nn.Linear(channel, self.d)
        self.fcs = nn.ModuleList([])
        for i in range(len(kernels)):
            self.fcs.append(nn.Linear(self.d, channel))
        self.softmax = nn.Softmax(dim=0)

    def forward(self, x):
        bs, c, _, _ = x.size()
        conv_outs = []
        ### split
        for conv in self.convs:
            conv_outs.append(conv(x))
        feats = torch.stack(conv_outs, 0)  # k,bs,channel,h,w

        ### fuse
        U = sum(conv_outs)  # bs,c,h,w

        ### reduction channel
        S = U.mean(-1).mean(-1)  # bs,c
        Z = self.fc(S)  # bs,d

        ### calculate attention weight
        weights = []
        for fc in self.fcs:
            weight = fc(Z)
            weights.append(weight.view(bs, c, 1, 1))  # bs,channel
        attention_weughts = torch.stack(weights, 0)  # k,bs,channel,1,1
        attention_weughts = self.softmax(attention_weughts)  # k,bs,channel,1,1

        ### fuse
        V = (attention_weughts * feats).sum(0)
        return V

四、YOLOv8中SK使用方法

1.YOLOv8中添加SK模块,首先在ultralytics/nn/modules/conv.py最后添加SK模块的代码。

2.在conv.py的开头__all__ = 内添加SK模块的类别名(SK的类别名在本文中为SKAttention)

3.在同级文件夹下的__init__.py内添加SKAttention的相关内容:(分别是from .conv import SKAttention ;以及在__all__内添加SKAttention)

4.在ultralytics/nn/tasks.py进行SK注意力机制的注册,以及在YOLOv8的yaml配置文件中添加SK即可。

首先打开task.py文件,按住Ctrl+F,输入parse_model进行搜索。找到parse_model函数。在其最后一个else前面添加以下注册代码:(本文续接上篇文章,加在了CBAM、ECA的位置)

        elif m in {CBAM,ECA,SKAttention}:#添加注意力模块,没有CBAM、ECA的,将CBAM、ECA删除即可
            c1, c2 = ch[f], args[0]
            if c2 != nc:
                c2 = make_divisible(min(c2, max_channels) * width, 8)
            args = [c1, *args[1:]]

然后,就是新建一个名为YOLOv8_SK.yaml的配置文件:(路径:ultralytics/cfg/models/v8/YOLOv8_SK.yaml)

# Ultralytics YOLO 

标签:conv,nn,self,YOLOv8,SK,注意力,channel
From: https://blog.csdn.net/2301_79619145/article/details/142579786

相关文章

  • 线程池结合futureTask
    概念线程池(ThreadPool)是一种并发编程中常用的技术,用于管理和重用线程。它由线程池管理器、工作队列和线程池线程组成。线程池的基本概念是,在应用程序启动时创建一定数量的线程,并将它们保存在线程池中。当需要执行任务时,从线程池中获取一个空闲的线程,将任务分配给该线程执行......
  • (开题)flask框架宠物上门服务系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景在快节奏的现代生活中,宠物已成为许多家庭的重要成员,它们不仅是忠诚的伴侣,更是情感的寄托。然而,随着工作压力的增加和生活方式的转变,许多宠......
  • (开题)flask框架宠物医院管理系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着宠物饲养的普及和宠物主人对宠物健康关注度的提升,宠物医疗行业迎来了前所未有的发展机遇。然而,传统的宠物医院管理模式在应对日益增长......
  • (开题)flask框架大学生企业推荐系统(程序+论文+python)
    本系统(程序+源码+数据库+调试部署+开发环境)带论文文档1万字以上,文末可获取,系统界面在最后面。系统程序文件列表开题报告内容研究背景随着高等教育的普及,大学生群体日益庞大,就业市场竞争也日益激烈。传统的人才招聘方式往往依赖于招聘网站的海量信息筛选和线下招聘会,这不仅......
  • 基于YOLOv8目标检测与chef-transformer(T5)从图像创建食谱
    前言在本文中,将演示如何使用从Roboflow获得的开源产品数据来训练我的YOLOv8模型,然后将其与从HuggingFace获得的chef-transformer(T5)模型集成。应用程序的主要目标是将检测到的对象参数化地发送到语言模型,并在NLP和CV之间建立关系。YOLOv8目标检测YOLOv8是由ultralytics......
  • (免费源码)计算机毕业设计必看必学 原创定制程序 java、PHP、python、小程序、文案全套
    高校学生社团管理系统摘要随着计算机科学技术的日渐成熟,人们已经深刻地认识到了计算机在各个领域中发挥的功能的强大,计算机已经进入到了人类社会发展的各个领域,并且发挥着十分重要的作用。目前学校学生社团的管理是一项系统而复杂的工作,它需要一个团队互相配合、分工协作。......
  • 基于 Flask 和 Vue 的 MVC 分层结构详解
    在现代web应用开发中,MVC(Model-View-Controller)架构是一种常用的设计模式。它将应用程序分为三部分:模型(Model)、视图(View)和控制器(Controller),以实现清晰的职责分离和代码的可维护性。今天,我们将详细解释如何在Flask和Vue的组合中实现这一架构。一、什么是MVC分层结构Model......