首页 > 其他分享 >YOLOv9:一个关注信息丢失问题的目标检测

YOLOv9:一个关注信息丢失问题的目标检测

时间:2024-07-08 22:19:59浏览次数:9  
标签:辅助 检测 网络 信息 PGI 丢失 梯度 YOLOv9

本文来自公众号“AI大道理” 当前的深度学习方法关注的是如何设计最合适的目标函数,使模型的预测结果最接近地面的真实情况。同时,必须设计一个适当的体系结构,以方便获取足够的预测信息。 现有方法忽略了一个事实,即输入数据在逐层进行特征提取和空间变换时,会丢失大量的信息。 YOLOv9给出了解决方案。 YOLOv9前身是YOLOv7,这是同一个团队。 1、YOLOv9的改进 在反向传播中深层特征层由于更加靠近标签,所以参数更容易更新,而浅层(离输入图片近的对方)由于山高皇帝远比较难以更新。怎么办?YOLOv9左右开弓,建立辅助头。右边是熟悉的类似yolov8一样的结构,是标准的neck+head结构。 左边则新建一个backbone,乱七八糟一堆neck,加上head作为辅助头。有什么用?backbone一般来说需要从右边的检测头经过neck再慢慢回传,现在YOLOv9有了左边的分支,左边的backbone离检测头要近很多,从这里回传又快损失又少。这个backbone和主路的backbone一模一样,共享参数。当然这么做只是在训练的时候更好的训练,一旦到了推理和测试阶段,辅助头果断抛弃,只留下标准的右边的结构即可。 这个思想之前在检测头部分已经有了,只不过那时候是为了更好的训练检测头,现在是为了更好的训练浅层部分。 (这个思想怎么这么熟悉,和resnet有异曲同工之妙)         添加图片注释,不超过 140 字(可选) 核心改进两点:

  • PGI(可编程梯度信息)
  • GLEAN(广义高效层聚合网络)
2、PGI(可编程梯度信息) 在深度网络的训练过程中,由于层与层之间的复杂映射,有用的信息可能会逐渐丢失,这会导致梯度信号变弱,最终影响网络的学习效率和预测准确性。PGI是一种旨在解决深度网络中的信息瓶颈问题的策略,它可以为目标任务提供完整的输入信息来计算目标函数,从而获得可靠的梯度信息来更新网络权值。 YOLOv9的PGI技术包括辅助可逆分支和多级辅助信息,这些设计有助于在网络的深层中保留更多的信息,生成更可靠的梯度,从而在训练过程中确保了更准确的目标与输入之间的关联。     添加图片注释,不超过 140 字(可选) (可编程梯度信息的解释:一个高大上的名字,无非就是想说你可以随意回传到哪一层,你可以自己决定,即可编程,主要还是在于这个思想)PAN (Path Aggregation Network):这种结构通过聚合不同路径的信息来缓解信息瓶颈问题,但仍然存在信息丢失的问题。 RevCol (Reversible Columns): 这种结构旨在保持信息流的完整性,通过可逆列来避免信息的损失,但代价是计算成本较高。 深度监督 (Deep Supervision): 这个方法通过在网络的不同深度层添加预测头来实现辅助监督,这可以帮助网络学习到多层次的辅助信息,但可能导致信息损坏。 可编程梯度信息 (PGI): 这是论文提出的新方法,它通过辅助可逆分支产生可靠的梯度,以供主分支使用,从而控制主分支在多个语义层次上的学习,这有助于更好地保留语义信息并优化梯度流。 图中的蓝色块代表神经网络中的层,灰色块代表预测头或辅助分支,虚线框高亮了每种方法的关键特征。 3、GLEAN(广义高效层聚合网络)       添加图片注释,不超过 140 字(可选)   广义高效层聚合网络(GELAN)是一种新颖的架构,它结合了 CSPNet 和 ELAN 原理来进行梯度路径规划。它优先考虑轻量级设计、快速推理和准确性。GELAN 通过允许任何计算块来扩展 ELAN 的层聚合,从而确保灵活性。 该架构旨在实现高效的特征聚合,同时在速度和准确性方面保持有竞争力的性能。GELAN的整体设计融合了CSPNet的跨级部分连接和ELAN的高效层聚合,以实现有效的梯度传播和特征聚合。 GELAN是将CSPNet和ELAN的特点结合在一起,并扩展以支持任何计算块的新型网络架构。 CSPNet: 这种架构包括一个分裂-合并的过程,它通过在网络的不同层之间分裂和合并特征来提高性能和效率。 ELAN: 这是一种更进一步的架构,它在CSPNet的基础上增加了多个卷积层(conv)的堆叠,每个卷积层都会进行特征转换,之后再进行合并。 GELAN: 提出的GELAN架构不仅模仿了CSPNet的分裂-合并机制,还扩展了ELAN的设计,使其可以使用任何类型的计算块,而不仅限于卷积层。 这种设计增加了网络的灵活性,使其能够根据不同的应用需求选择最合适的计算块。   4、其他 backbone:主要就是多了一条backhone,backbone中使用了RepNCSPELAN4模块。 neck/head:主要是增加了辅助头。 loss function:loss为DFL Loss + CIoU Loss 正负样本匹配策略:为TaskAlign样本匹配   5、总结 YOLOv9结合了PGI(可编程梯度信息)和GELAN(广义高效层聚合网络)技术来克服信息瓶颈和深度监督在轻量级网络中的不适用性问题。 YOLOv9的PGI技术包括辅助可逆分支和多级辅助信息,这些设计有助于在网络的深层中保留更多的信息,生成更可靠的梯度,从而在训练过程中确保了更准确的目标与输入之间的关联。 (左边的辅助头可以千变万化,又是一个魔改的方向,目测要yolov1000000......)       添加图片注释,不超过 140 字(可选)       —————— 浅谈则止,细致入微AI大道理 扫描下方“AI大道理”,选择“关注”公众号—————————————————————       —————————————————————   公众号《AI大道理》征稿函​mp.weixin.qq.com/s?__biz=MzU5NTg2MzIxMw==&mid=2247489802&idx=1&sn=228c18ad3a11e731e8f325821c184a82&chksm=fe6a2ac8c91da3dec311bcde280ad7ee760c0c3e08795604e0f221ff23c89c43a86c6355390f&scene=21#wechat_redirect | 留言吧​mp.weixin.qq.com/cgi-bin/appmsg?t=media/appmsg_edit&action=edit&type=77&appmsgid=100019409&isMul=1&replaceScene=0&isSend=0&isFreePublish=0&token=2066879393&lang=zh_CN&timestamp=1720447743625  

标签:辅助,检测,网络,信息,PGI,丢失,梯度,YOLOv9
From: https://www.cnblogs.com/AIBigTruth/p/18290791

相关文章

  • 在计算机取证中,Volatility 是一个流行的开源内存取证工具,专门用于分析内存镜像以发现
    在计算机取证中,Volatility是一个流行的开源内存取证工具,专门用于分析内存镜像以发现系统运行时的信息。它提供了丰富的功能和插件,用于检测和分析操作系统中的各种活动,包括进程、网络连接、注册表、文件系统等。下面是一些Volatility的基本特点和使用场景:主要特点:多平台支持......
  • 自动驾驶感知项目-基于多线激光雷达的小目标锥桶空间位置检测算法(ROS,C++,滤波)
    一:序言想了解更多自动驾驶项目课程以及获取学习代码的可以参考这个链接无人车采用纯跟踪算法跟随离线路径感知锥桶项目中:滤波处理是进行激光雷达目标检测的常见步骤,对原始点云数据进行预处理达到减少噪声、无效点或者数据量的效果。常用的点云滤波方法包括体素滤波、法......
  • Python OpenCv对规则物体进行实时检测
    前言很多情况需要对物体进行检测,常规的方法也有很多种。但是检测出来的边缘一般都是非常多,结果也是非常杂乱的,显然这种结果不是我们想要的。如果颜色相较于背景非常鲜艳的可以调节hsv阈值再进行检测,如果是一直在运动的物体可以通过帧差法进行物体检测,还有很多高深的算法也可以进......
  • 目标检测小例子
    YOLO(YouOnlyLookOnce)是一种流行的目标检测算法,它以其快速和高效而闻名。YOLOv5是YOLO系列的第五个版本,它在性能和速度上都有所改进。以下是使用YOLOv5进行目标检测的一个基本示例代码,假设你已经安装了Python和必要的库,比如PyTorch和OpenCV。首先,你需要安装YOLOv5的库。......
  • 目标检测1--Pytorch目标检测之yolov1
    文章目录前言核心思想网络结构算法原理算法流程关于标定框框的中心点(x,y)的解释框的宽高(w,h)的解释置信度c的解释:class类别概率详解损失函数坐标损失置信度损失分类损失优缺点前言论文地址:yolov1YOLOv1(YouOnlyLookOnceversion1)是由JosephRedmon等人......
  • 昇思25天学习打卡营第14天|SSD目标检测
    今天学习的是SSD目标检测内容,首先介绍什么是SSD?SSD,全称SingleShotMultiBoxDetector,是WeiLiu在ECCV2016上提出的一种目标检测算法。使用NvidiaTitanX在VOC2007测试集上,SSD对于输入尺寸300x300的网络,达到74.3%mAP(meanAveragePrecision)以及59FPS;对于512x512的网......
  • 目标检测算法简介
    关注我,持续分享逻辑思维&管理思维&面试题;可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导;推荐专栏《10天学会使用asp.net编程AI大模型》,目前已完成所有内容。一顿烧烤不到的费用,让人能紧跟时代的浪潮。从普通网站,到公众号、小程序,再到AI大模型网站。干货满满。学成后可......
  • 电脑文件丢失数据恢复
    一、从回收站恢复步骤:打开回收站,查看是否有误删除的文件。右键点击需要恢复的文件,选择【还原】。等待文件还原完成,检查原位置是否已恢复该文件。注意:如果在删除文件后立即意识到错误,且未进行其他操作,可尝试使用【Ctrl+Z】快捷键撤销删除。撤销操作后,文件将恢复到删除前的状......
  • 电脑开机检测不到硬盘怎么办 电脑检测不到硬盘问题解决
    电脑开机检测不到硬盘,无法进入系统或者显示“RebootandSelectproperBootdevice”等错误信息。这种情况可能会导致我们的数据丢失或者无法使用电脑。一、电脑检测不到硬盘的可能原因电脑检测不到硬盘的原因主要有以下几种:1、硬盘连接线松动或损坏:硬盘是通过SATA线或M.2插......
  • YOLOv8改进 | 注意力机制 | 增强模型在图像分类和目标检测BAM注意力【小白必备 + 附完
    秋招面试专栏推荐:深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转......