首页 > 其他分享 >YOLOv11改进 | 注意力篇 | YOLOv11引入24年最新Mamba注意力机制MLLAttention

YOLOv11改进 | 注意力篇 | YOLOv11引入24年最新Mamba注意力机制MLLAttention

时间:2024-10-08 20:19:18浏览次数:10  
标签:24 Transformer 模型 YOLOv11 设计 线性 Mamba 注意力

1. MLLAttention介绍

1.1  摘要: Mamba 是一种有效的状态空间模型,具有线性计算复杂度。 最近,它在处理各种视觉任务的高分辨率输入方面表现出了令人印象深刻的效率。 在本文中,我们揭示了强大的 Mamba 模型与线性注意力 Transformer 具有惊人的相似之处,而线性注意力 Transformer 在实践中通常表现不佳。 通过探索有效的 Mamba 和低于标准的线性注意力 Transformer 之间的异同,我们提供全面的分析来揭开 Mamba 成功背后的关键因素。 具体来说,我们在统一的公式中重新表述了选择性状态空间模型和线性注意力,将 Mamba 重新表述为线性注意力 Transformer 的变体,具有六个主要区别:输入门、忘记门、捷径、无注意力归一化、单头和修改块 设计。 对于每个设计,我们都会仔细分析其优缺点,并凭经验评估其对视觉任务中模型性能的影响。 有趣的是,结果强调了遗忘门和区块设计是 Mamba 成功的核心贡献者,而其他四种设计则不太重要。 基于这些发现,我们通过将这两个关键设计的优点融入到线性注意力中,提出了类曼巴线性注意力(MLLA)模型。 所得模型在图像分类和高分辨率密集预测任务中均优于各种视觉 Mamba

标签:24,Transformer,模型,YOLOv11,设计,线性,Mamba,注意力
From: https://blog.csdn.net/tsg6698/article/details/142768391

相关文章

  • 2024.10.8 test
    nf#34A定义两个长度相等的数列相似,当且仅当每个下标对应值在两个数列中的排名相等。对于一个长\(n\)的排列,定义\(f(A,k)\)表示有多少长\(k\)的排列和\(A\)的至少一个子序列相似。排列\(A\)的值是\(\sum_{k=1}^n[f(A,k)=C_n^k]\)。给出一个排列,有若干位置待定,求值......
  • 【2024.10.07】责任感
    终于还是做出了重要的决定,在厦门岛内买了房为什么选择这个时候买房呢一是最重要是因为一些宏观的政策改变了吧,落户政策改变了,只要有房就能落户,落户马上就能给孩子读书我和妹妹正好有年龄代差,现在买的话,后年交房后,妹妹就能在厦读书了等妹妹用完学位后,我如果这时候有孩子了,也正......
  • キーエンスプログラミングコンテスト2024(AtCoder Beginner Contest 374)
    A.Takahashisan2判断一个字符串是否以san结尾usingnamespacereader;intmain(){strings;cin>>s;if(s[s.length()-1]=='n'ands[s.length()-2]=='a'ands[s.length()-3]=='s'){cout<<"Yes";......
  • 2024年华为OD笔试机试E卷- 补种未成活胡杨 (java/c++/python)
    华为OD机试E卷2024真题目录(java&c++&python)本人习惯先看输入输出描述,可以明确知道哪些数据已知,需要去得到什么结果,再代入更有目的性地阅读题干内容,快速理解,所以把输入输出描述放在前面,你可以试下这样阅读对你是否有帮助。输入描述N总种植数量1≤N≤100000M......
  • 2024年华为OD笔试机试E卷- 关联子串 (java/c++/python)
    华为OD机试E卷2024真题目录(java&c++&python)本人习惯先看输入输出描述,可以明确知道哪些数据已知,需要去得到什么结果,再代入更有目的性地阅读题干内容,快速理解,所以把输入输出描述放在前面,你可以试下这样阅读对你是否有帮助。输入描述输入两个字符串,分别为题目中描述的......
  • 20222325 2024-2025-1 《网络与系统攻防技术》实验一实验报告
    1.实验内容缓冲区溢出基本知识:堆栈、函数调用。shellcode技术以及其在各平台的运用与防御。BOF攻击防御技术。2.实验目标本次实践的对象是一个名为pwn1的linux可执行文件。该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。该程序同时包含另......
  • 202410-Notes for reading
    TDB1.Gravityexperimentswithradiopulsarshttps://ui.adsabs.harvard.edu/abs/2024LRR....27....5F/abstract2.PhD,Porayko,NataliyaKonstantinovna_2019_ProbingtheInterstellarMediumandDarkMatterwithPulsars5.PhD,2020,NataliyaK.PoraykoProbin......
  • 20222310 2024-2025-1 《网络与系统攻防技术》实验一实验报告
    一、实验内容1.实验目标本次实验的对象是一个名为pwn1的linux可执行文件。该程序正常执行流程是:main调用foo函数,foo函数会简单回显任何用户输入的字符串。该程序同时包含另一个代码片段,getShell,会返回一个可用Shell。正常情况下这个代码是不会被运行的。我们实验的目标就是想......
  • 【1024程序猿节】IT人#摸鱼计划#,多重奖励等你来拿!
    10月摸鱼计划如期而至,全新上线3款活动任务,还有多重奖励等你来拿!【活动时间】发文时间:2024年10月8日—2024年10月31日【活动任务】以下任务福利可同享!!同时,我们为大家整理了容易被百度收录的关键词,当你写作的时候,可以直接选择热点且擅长的关键词进行博文创作。 直达热点关键词库>>任......
  • 「完美收官」科东软件2024上海国际工博会精彩回顾:鸿道操作系统赋能新型工业化
    第24届中国国际工业博览会已经落下帷幕。历经24届,工博会已成为全球工业发展的“风向标”。今年的中国工博会以“工业聚能新质领航”为主题,工业自动化、数控机床与金属加工、新能源与智能网联汽车、机器人等领域重磅展品悉数亮相,展示了中国新型工业化高质量发展的核心技术,为......