YOLOv9改进系列，YOLOv9主干网络替换为RepViT (CVPR 2024，清华提出，独家首发)，助力涨点

时间：2024-09-17 12:21:48浏览次数：16

标签：卷积混合器 YOLOv9 2024 CVPR CNN SE RepViT 轻量级

在这里插入图片描述

摘要

轻量级视觉变换器（ViTs）在资源受限的移动设备上表现出优越的性能和较低的延迟，相比之下轻量级卷积神经网络（CNNs）稍显逊色。研究人员发现了许多轻量级 ViTs 和轻量级 CNNs 之间的结构联系。然而，它们在块结构、宏观和微观设计上的显著架构差异尚未得到充分研究。在本研究中，我们从 ViT 的角度重新审视轻量级 CNNs 的高效设计，并强调其在移动设备上的光明前景。具体而言，我们通过整合轻量级 ViTs 的高效架构设计，逐步增强标准轻量级CNN（即MobileNetV3）的移动友好性。最终形成了一种新的纯轻量级 CNN 家族，即 RepViT。大量实验表明，RepViT 优于现有的最先进的轻量级 ViTs，并在各种视觉任务中表现出良好的延迟性能。

介绍

通过集成轻量级 ViT 的设计理念，如分离的 token 混合器和通道混合器，使用结构重参数化技术（SR），调整扩展比和网络宽度等，RepViT 模型实现了在移动设备上的高效推理。RepViT 在多个计算机视觉任务（包括图像分类、物体检测、实例分割等）上表现出色，与其他轻量级ViT和CNN模型的性能对比显示，RepViT在延迟和准确率方面具有显著的优势。CNN 的性能和延迟通常受到卷积核大小的影响。例如，ConvNeXt 通过使用大卷积核来捕捉长距离依赖关系，展现了性能提升的效果。同样，RepLKNet 展示了一种强大的使用超大卷积核的 CNN 范式。然而，较大的卷积核并不适合移动设备，因为它们的计算复杂度和内存访问成本较高。此外，与3×3卷积相比，较大卷积核通常未被编译器和计算库高度优化。SE层是轻量级 CNN 的常见选择，通过全局信息动态调整通道权重。然而，SE层带来了额外的计算成本，尤其是在通道数量较大的后期阶段。为了优化这一点，在 RepViT 块中设置了可选的 SE 层。通过试验，发现将 SE 层放置在早期阶段效果更好，而后期阶段对性能的影响较小。因此，将 SE 层仅放置在前两个阶段。
如下图，（a）是带有可选挤压和激励（SE）层的 MobileNetV3 模块。（b）是设计的 RepViT 模块，通过结构重新参数化技术将令牌混合器和通道混合器分开。SE 层在 RepViT 模块中也是可选的。为简化起见，省略了规范层和非线性部分。
在这里插入图片描述

理论详解可以参考链接：论文地址
代码可在这个链接找到：代码地址

本文在YOLOv9中的主干网络

标签：卷积,混合器,YOLOv9,2024,CVPR,CNN,SE,RepViT,轻量级
From： https://blog.csdn.net/weixin_44779079/article/details/142310128

计算机人工智能前沿进展-大语言模型方向-2024-09-17
计算机人工智能前沿进展-大语言模型方向-2024-09-171.LargeLanguageModelsinBiomedicalandHealthInformatics:AReviewwithBibliometricAnalysisHYu,LFan,LLi,JZhou,ZMa,LXian,WHua,SHe…-JournalofHealthcare…,2024生物医学和健康信......
【2024研赛】【华为杯】2024 年研究生数学建模比赛思路、代码更新中.....
......
教育部等十八部门关于加强新时代中小学科学教育工作的意见 20240917_085127
原文教育部等十八部门关于加强新时代中小学科学教育工作的意见_国务院部门文件_中国政府网https://www.gov.cn/zhengce/zhengceku/202305/content_6883615.htm概述教育部等十八部门联合发布此意见，强调要加强科学教育，推动校内校外融合，规范科技类校外培训。这一政策为少儿编程教......
基于SpringBoot+Vue的学生交流互助平台设计与实现(2024最新，原创项目)
文章目录1.前言2.详细视频演示3.论文参考4.项目运行截图5.技术框架5.1后端采用SpringBoot框架5.2前端框架Vue6.可行性分析7.系统测试7.1系统测试的目的7.2系统功能测试8.数据库表设计9.代码参考10.数据库脚本11.作者推荐项目12.为什么选择我？13.获取源......
当年青少年学习编程的重要性政策原文 20240917_090943
新一代人工智能发展规划20240917_082658_鲸鱼编程pyhui的技术博客_51CTO博客https://blog.51cto.com/u_13137233/12036071国务院关于印发全民科学素质行动规划纲要（2021—2035年）的通知20240917_083539_鲸鱼编程pyhui的技术博客_51CTO博客https://blog.51cto.com/u_13137233/12......
【保奖思路】2024年华为杯研赛F题保奖思路（点个关注，后续会更新）
您的点赞收藏是我继续更新的最大动力！一定要点击文末的卡片，那是获取资料的入口！现分享2023年华为杯研赛F题高质量思路，供大家学习：问题1思路2023华为杯研究生数学建模F题问题1：如何有效应用双偏振变量改进强对流预报，仍是目前气象预报的重点难点问题。请利用题目提供的数据，建立......
【保奖思路】2024年华为杯研赛F题保奖思路（点个关注，后续会更新）
您的点赞收藏是我继续更新的最大动力！一定要点击文末的卡片，那是获取资料的入口！现分享2023年华为杯研赛F题高质量思路，供大家学习：问题1思路2023华为杯研究生数学建模F题问题1：如何有效应用双偏振变量改进强对流预报，仍是目前气象预报的重点难点问题。请利用题目提供的数据，建立......
2024杭电多校复盘（1~5）
因为678三场是我们验的题，我基本没补题，910两场也没认真打，所以只复盘了前5场。第一场先开01，先想到的是sam做法，结果写到一半发现，这题内存只给了64M，sam开不下，于是转行SA，过了，但是很勉强。看了题解才发现哈希直接秒了，怪不得这题过的人这么多。02星星，就是个n^2的背包，但是队......
2024.9最新：CUDA安装，pytorch库安装
目录一、CUDA安装1.查看自己电脑适配的CUDA的最高版本2.安装CUDA3.检查环境变量是否配置，安装是否成功二、pytorch库安装1.pytorch库下载2.选择合适的版本3.查看版本一、CUDA安装1.查看自己电脑适配的CUDA的最高版本在命令提示符里输入nvidia-smi表格右上角显示的C......

YOLOv9改进系列，YOLOv9主干网络替换为RepViT (CVPR 2024，清华提出，独家首发)，助力涨点

摘要

介绍

相关文章

赞助商

阅读排行