首页 > 其他分享 >YOLOv9改进,YOLOv9主干网络替换为GhostNetV3(2024年华为提出的轻量化架构,全网首发),助力涨点

YOLOv9改进,YOLOv9主干网络替换为GhostNetV3(2024年华为提出的轻量化架构,全网首发),助力涨点

时间:2024-09-27 10:23:50浏览次数:3  
标签:涨点 紧凑型 训练 卷积 模型 YOLOv9 2024 GhostNetV2 GhostNetV3


在这里插入图片描述

摘要

GhostNetV3 是由华为诺亚方舟实验室的团队发布的,于2024年4月发布。
在这里插入图片描述

摘要:紧凑型神经网络专为边缘设备上的应用设计,具备更快的推理速度,但性能相对适中。然而,紧凑型模型的训练策略目前借鉴自传统模型,这忽略了它们在模型容量上的差异,可能阻碍紧凑型模型的性能提升。在本文中,通过系统地研究不同训练成分的影响,我们介绍了一种用于紧凑型模型的强大训练策略。我们发现,适当的重参数化和知识蒸馏设计对于训练高性能的紧凑型模型至关重要,而一些常用于训练传统模型的数据增强方法(如 Mixup 和 CutMix)反而会导致性能下降。作者在 ImageNet-1K 数据集上的实验表明,为紧凑型模型设计的专门训练策略适用于各种架构,包括 GhostNetV3、MobileNetV2 和 ShuffleNetV2。具体而言,GhostNetV3 1.3× 在移动设备上以仅 269M FLOPs 和 14.46ms 的延迟实现了 79.1% 的 top-1 准确率,远超其常规训练的对手。此外,还可以扩展到目标检测场景。

理论介绍

GhostNetV3 提供了以下几种常见的模型权重,不同宽度缩放因子(Width Scaling):

  • 0.5x: 较小模型深度,用于资源更受限的场景。
  • 1.0x: 标准模型。
  • 1.3x: 模型深度比1.0x更深。
  • 1.6x: 更大的模型版本,适用于计算资源较多的设备。

大家可以根据不同场景选择合适的模型宽度缩放因子,本文选择 0.5,具体可见第二章的代码。

GhostNetV2 和 GhostNetV3 的架构如下:
在这里插入图片描述

GhostNets(GhostNetV1 和 GhostNetV2)是为在移动设备上高效推理而设计的最先进的紧凑型模型。其关键架构是 Ghost 模块,可以通过廉价操作生成更多特征图来替换原始卷积。在普通卷积中,输出特征 Y 通过 Y = X ∗ W 获得,其中 W ∈ R cout×cin×k×k 是卷积核,X 是输入特征。cin 和 cout 分别表示输入和输出通道维度。k 是核大小,∗ 表示卷积操作。Ghost 模块通过两个步骤减少普通卷积的参数和计算成本。

GhostNetV3 引入了多分支重参数化机制,通过在卷积层中添加额外的平行分支来改善性能。这些分支在训练过程中提供更多的表征能力,最终通过将多个分支重组为一个卷积层来实现推理时的高效性。通过添加配备 BatchNorm 层的重复分支将再参数化引入紧凑型模型。
GhostNetV3 在 GhostNetV2 的基础上进行了进一步的优化,主要体现如下:

  • 重参数化训练 (Training of Convolution):GhostNetV3 引入了

标签:涨点,紧凑型,训练,卷积,模型,YOLOv9,2024,GhostNetV2,GhostNetV3
From: https://blog.csdn.net/weixin_44779079/article/details/142534617

相关文章

  • 汇付天下2024北京服务商生态合作峰会盛大举行
    继广州站、成都站成功举办,9月25日,以“数智新生长,汇见新未来”为主题的2024汇付服务商生态合作峰会-北京站盛大启幕。众多汇付服务商、生态伙伴等齐聚一堂,共商数字生态下的新增长、共绘数字时代的新蓝图。汇付天下助理总裁高亮山参会并致辞。他首先对来自全国各地的新老朋友......
  • 【2024-09-26】共频童真
    20:00在人生的旅途中,我们也许会遗失很多美好、遭遇许多挫折,我们可以失望,可以失败,但绝不能绝望,不能放弃!一切都可以重新开始,因为明天是新的一天了!                                         ......
  • P10681 COTS/CETS 2024 奇偶矩阵 Tablica
    P10681COTS/CETS2024奇偶矩阵Tablica来自qnqfff大佬的梦幻dp。约定二元组\((n,m)\)表示一个\(n\)行\(m\)列的矩形。不添加说明的子问题,限制与题面一致。思路先考虑放最后一行,发现你填的位置经过变换后可以得到其他的结果,也就是说只要乘上变换的方案数就可以任......
  • 2024-2025专题二题单 - 题解
    A-MoneyinHand(记忆化搜索)原题链接题解B-GoodGraph(并查集)原题链接题解C-IceSkating(dfs求连通块)原题链接题解D-TheLakes(dfs求连通块,连通块内累加,多组数据注意初始化)原题链接题解E-LearningLanguages(建图,dfs统计连通块个数,答案为个数-1)原题链接题......
  • 大势智慧精彩亮相INTERGEO 2024全球顶尖行业盛会!
    当地时间9月24日,空间地理信息领域的全球顶尖行业盛会INTERGEO2024在德国斯图加特拉开帷幕。大势智慧携“三维重建全流程软硬件产品矩阵”与“空间AI解决方案”亮相1号馆D1.074展位,在全球舞台展示中国企业在国际测绘地理信息领域的技术创新实力。在此次展会上,大势智慧所展......
  • 关于科技特长生 家长与孩子需知 20240926_232535
    初识科技特长生什么是科技特长生为什么科技特长生火成为科技特长生的优势高中升大学特招赛道如何成为科技特长生......
  • Java面试八股文及答案整理( 2024年 最新版,持续更新)
    一、Java基础1.JDK和JRE有什么区别?JDK:JavaDevelopmentKit的简称,java开发工具包,提供了java的开发环境和运行环境。JRE:JavaRuntimeEnvironment的简称,java运行环境,为java的运行提供了所需环境。具体来说JDK其实包含了JRE,同时还包含了编译java源码的编......
  • 2024/09/25 模拟赛总结
    rk5,\(100+40+5+0=145\)。T2上物理课把式子推出来了,感谢孟德的馈赠#A.变换简单dp,为什么都写\(3\)维啊令\(dp_{i,j,0/1,0/1}\)为考虑前\(i\)位改了\(j\)位,当前是/不是“山谷”,前一位是/不是“山谷”显然,相邻两位一定不会都是山谷,所以\(dp_{i,j,1,1}\)一定不存在考......
  • 【2024计算机毕业设计】基于jsp+mysql的JSP在线水果超市商城
    运行环境:最好是javajdk1.8,我在这个平台上运行的。其他版本理论上也可以。IDE环境:Eclipse,Myeclipse,IDEA或者SpringToolSuite都可以,如果编译器的版本太低,需要升级下编译器,不要弄太低的版本tomcat服务器环境:Tomcat7.x,8.x,9.x版本均可操作系统环境:WindowsXP/7......
  • 2024 CCPC网络赛复盘
    补题链接:https://codeforces.com/gym/105336名次:103赛时:BCDEGIJKL(9题)赛后:F首先是OMS与PTA的保留节目:爆炸去年是新版OMS闪退,今年是直接塞爆进不去。教室一片骚动,不过既然比赛已经开始了,那就可以动键盘,先敲几个板子再说。我上来先敲最黑盒的网络流,小武过来敲了个fhq......