首页 > 其他分享 >YOLOv11改进,YOLOv11自研检测头融合HyCTAS的Self_Attention自注意力机制(2024),并添加小目标检测层(四头检测),适合目标检测、分割、关键点任务

YOLOv11改进,YOLOv11自研检测头融合HyCTAS的Self_Attention自注意力机制(2024),并添加小目标检测层(四头检测),适合目标检测、分割、关键点任务

时间:2025-01-10 17:57:58浏览次数:3  
标签:HyCTAS 四头 特征 检测 尺度 目标 YOLOv11


在这里插入图片描述


摘要

论文提出了一种新的搜索框架,名为 HyCTAS,用于在给定任务中自动搜索高效的神经网络架构。HyCTAS框架结合了高分辨率表示和自注意力机制,通过多目标优化搜索,找到了一种在性能和计算效率之间的平衡。
在这里插入图片描述


# 理论介绍

自注意力(Self-Attention)机制是HyCTAS框架中的一个重要组成部分,是一种能够捕捉输入序列中不同位置之间关系的机制。核心思想是:对于输入的每一个元素,它都会通过与所有其他元素的关系来重新计算自己的表示,这种机制允许网络根据上下文信息动态地调整其对输入各部分的关注程度。
在论文中,自注意力模块主要用于捕获长程依赖,这意味着它能够关注输入数据中远离当前位置的相关信息。例如,在图像分割任务中,自注意力模块能够帮助网络理解图像中不同区域之间的关系,提升网络对图像的整体理解能力。下图摘自论文
在这里插入图片描述

小目标理论

在YOLOv11 中,输入图像的尺寸为 640x640x3,经过 8 倍、16 倍和 32 倍下采样后分别得到 80x80、40x40 以及 20x20 大小的特征图,网络最终在这三个不同尺度的特征图上进行目标检测。在这三个尺度的特征图中,局部感受野最小的是 8 倍下采样特征图,即如果将该特征图映射到原输入图像,则每个网格对应原图 8x8 的区域。对于分辨率较小的目标而言,8 倍下采样得到的特征图感受野仍然偏大,容易丢失某些小目标的位置和细节信息。为了改善目标漏检现状,对 YOLOv8 的 Head 结构进行优化,在原有的三尺度检测头的基础之上,新增一个针对微小目标检测的检测头 ,YOLOv11 原有 P3、P4 和 P5 这 3 个输出层,分别用于检测小、中、大目标,增加 P2 检测层后,网络能在4个不同尺度的特征图上做检测,P2 能检测到最小目标分辨率为 4x4。通过增加小尺度检测头的方式,整个网络能在 4 倍、8 倍、16 倍和 32 倍下采样特征图上预测不同尺度的目标,大幅度提高了算法的多尺度目标检测性能。四个检测头如下表格所示:

名称 特征图大小 检测目标大小 用于检测目标
P2/4 160x160 4x4 以上 微小目标
P3/8 80x80 8x8 以上 小目标
P4/16 40x40 16x16 以上 中型目标
P5/32 20x20 32x32 以上 大型目标

理论详解可以参考链接:

标签:HyCTAS,四头,特征,检测,尺度,目标,YOLOv11
From: https://blog.csdn.net/weixin_44779079/article/details/145044178

相关文章

  • YOLOv8改进,YOLOv8自研检测头融合HyCTAS的Self_Attention自注意力机制,2024,并添加小目标
    摘要论文提出了一种新的搜索框架,名为HyCTAS,用于在给定任务中自动搜索高效的神经网络架构。HyCTAS框架结合了高分辨率表示和自注意力机制,通过多目标优化搜索,找到了一种在性能和计算效率之间的平衡。#理论介绍自注意力(Self-Attention)机制是HyCTAS框架中的一个重要组......
  • 电源检测设备深度剖析:专业视角下的工业电力设备
    电源检测设备是工业电力系统中至关重要的组成部分,用于确保供电系统的稳定性和可靠性。从专业视角来看,这些设备不仅需要具备高精度的测量能力,还应能够适应各种复杂的工业环境。一、核心功能与技术原理电压与电流测量:这是电源检测设备最基本的功能之一。通过高精度传感器实时监测......
  • 基于YOLOv8深度学习的无人机视角迷彩军事人员目标检测系统
    随着无人机技术的迅猛发展及深度学习在目标检测领域的广泛应用,基于无人机视角的军事目标检测系统逐渐成为现代战场监控与侦察的重要工具。迷彩伪装人员作为一种常见的隐蔽战术,对传统目标检测方法提出了较高的挑战。本文提出了一种基于YOLOv8深度学习算法的无人机视角迷彩军事目......
  • vue3 + vite +ts 实现版本更新检查(检测到版本更新时提醒用户刷新页面)
    背景当一个页面很久没刷新,又突然点到页面。由于一些文件是因为动态加载的,当重编后(如前后端发版后),这些文件会发生变化,就会出现加载不到的情况。进而导致正在使用的用户,点击页面发现加载不顺畅、卡顿问题。解决思路使用Vite构建一个插件,在每次打包时自动生成version.json版本信息文......
  • 漏水检测需要根据不同的情况采取不同的方法。对于一般的小范围漏水,可以先尝试目视检查
    房屋漏水问题可能出现在多个地方,包括屋顶、墙体、窗户、管道等。漏水不仅会对房屋结构和居住环境造成损害,还可能带来霉菌生长、墙面脱落等二次损害。因此,及时检测和修复漏水问题非常重要。下面是几种常见的房屋漏水检测方法:1. 目视检查法屋顶:检查屋顶瓦片是否破损、松动,或者有......
  • 数据集-目标检测系列- 收割机 测数据集 harvesters >> DataBall
    数据集-目标检测系列-收割机测数据集harvesters>>DataBallDataBall助力快速掌握数据集的信息和使用方式,会员享有百种数据集,持续增加中。 需要更多数据资源和技术解决方案,知识星球:“DataBall-X数据球(free)”贵在坚持!数据样例项目地址:*相关项目1)数据集可......
  • Nessus 是一款功能强大的网络漏洞扫描工具,用于检测和评估计算机网络中可能存在的安全
    DownloadTenableNessus|Tenable® Nessus 10.8.3是什么?Nessus是一款功能强大的网络漏洞扫描工具,用于检测和评估计算机网络中可能存在的安全漏洞。它由Tenable公司开发,最初是作为一个开源项目发布的,但后来转为商业产品。Nessus可以扫描计算机系统、网络设备、Web应......
  • 集智书童 | 清华大学/NVIDIA/斯坦福等在没有3D数据的情况下训练一个开放词汇的单目3D
    本文来源公众号“集智书童”,仅用于学术分享,侵权删,干货满满。原文链接:清华大学/NVIDIA/斯坦福等在没有3D数据的情况下训练一个开放词汇的单目3D物体检测模型!最近,由于其在自动驾驶和机器人领域的广泛应用,无词汇3D目标检测受到了广泛关注,该方法旨在有效识别以前未见过的领域......
  • 关于字符检测的算法
    说到字符检测.,我们想到的首先就是提取字符,然后创建模版,利用定位仿射变换到新的字符上,做差值运算,得到的插值区域就是我们的异常区域.那么具体步骤怎么实现,halcon算子又该如何运用呢?①图像的预处理.a.一般选择自动阈值或绝对阈值.得到感兴趣区域.自动阈值算法,请......
  • 2025年百科荣创Android -- AI视觉检测模型集成--
    文章目录文章目录前言AndroidOCR文字识别简介PyddleOCR实现方法Android智能交通灯检测简介智能交通灯检测实现方法Android手势识别简介手势识别实现方法Android车牌矫正识别简介车牌矫正与识别方法Android口罩识别简介口罩识别实现方法结语文章目录......