王炸升级！Mamba加持UNet，能发高区还不卷

时间：2025-01-10 11:03:23浏览次数：3

2024深度学习发论文&模型涨点之——Mamba+UNet

众所周知，CNN 在长距离建模能力方面存在局限性，而 Transformer 随能全局建模但受到其二次计算复杂度的限制。因此，以 Mamba 为代表的状态空间模型（SSMs）已然成为一种有前景的方法。

Mamba是一种状态空间模型（SSM），它是一种用于时间序列分析的统计模型。Mamba模型能够处理长序列数据，并能够捕捉数据中的全局上下文信息。在图像分割的上下文中，Mamba被用来增强网络对图像全局信息的捕捉能力。

UNet是一种深度学习模型，主要用于图像分割任务，特别是在医学图像分析领域。它由Falk et al.在2015年提出。UNet的结构呈U形，包含一个收缩路径（编码器）和一个扩展路径（解码器），两者通过跳跃连接相连。这种结构使得网络能够在不同尺度上捕获图像特征，并在解码器中重新组合这些特征，以实现精确的分割。

我整理了一些Mamba+UNet【论文+代码】合集，需要的同学公人人人号【AI创新工场】自取。

论文精选

论文1：

LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation

LKM-UNet：大核视觉Mamba UNet用于医学图像分割

方法

大核Mamba：利用大Mamba核在局部空间建模方面的优势。

层次化和双向Mamba块：设计了一种新型的层次化和双向大核Mamba块，以增强SSMs的表示建模能力。

像素级和补丁级SSM：提出了由像素级SSM（PiM）和补丁级SSM（PaM）组成的层次Mamba模块，增强了局部邻域像素级和长距离全局补丁级建模。

创新点

性能提升：LKM-UNet在3D Abdomen CT数据集上的DSC和NSD分别达到了86.82和90.02，相较于其他方法有显著提升。

计算效率：通过使用大核Mamba设计，LKM-UNet在保持计算效率的同时实现了大感受野。

结构优化：LKM-UNet通过引入PiM和PaM，以及双向Mamba（BiM），在局部和全局特征建模方面均显示出优越性。

论文2：

Mamba-SEUNet: Mamba UNet for Monaural Speech Enhancement

Mamba-SEUNet：用于单声道语音增强的Mamba UNet

方法

架构整合：将Mamba与U-Net架构整合，用于语音增强任务。

双向Mamba：利用双向Mamba建模不同分辨率下语音信号的前后依赖性。

多尺度信息：通过跳跃连接捕获多尺度信息。

创新点

性能提升：Mamba-SEUNet在VCTK+DEMAND数据集上达到了3.59的PESQ得分，结合感知对比拉伸技术后，PESQ得分进一步提升到3.73。

计算复杂度：在保持低计算复杂度的同时实现了SOTA性能。

结构优化：通过增加TS-Mamba块的数量，Mamba-SEUNet在PESQ、STOI和MOS评分上均有所提升。

论文3：

LightM-UNet: Mamba Assists in Lightweight UNet for Medical Image Segmentation

LightM-UNet：曼巴助力轻量级UNet进行医学图像分割

方法

轻量级UNet框架：提出了一个轻量级的UNet框架LightM-UNet，通过整合曼巴和UNet来解决计算资源限制带来的挑战。

残差视觉曼巴层（RVM Layer）：利用RVM Layer以纯曼巴方式提取深层语义特征，并模拟长距离空间依赖关系，计算复杂度为线性。

多视图交叉监督学习：通过不同网络架构的视角多样性，增强了生成的伪标签的鲁棒性和泛化能力。

创新点

参数和计算成本的显著降低：与著名的nnU-Net相比，LightM-UNet在参数和计算成本上分别减少了116倍和21倍，同时实现了更优的分割性能。

残差视觉曼巴层（RVM Layer）：提出了RVM Layer，以几乎不引入新参数和计算开销的方式，增强了SSM对视觉图像长距离空间依赖关系的建模能力。

性能提升：在LiTs数据集上，与nnU-Net相比，LightM-UNet在Dice系数上提高了0.04，准确率上提高了0.02，同时在Montgomery&Shenzhen数据集上，Dice系数达到了0.9617，准确率为0.9274。

论文4：

VM-UNet: Vision Mamba UNet for Medical Image Segmentation

VM-UNet：视觉曼巴UNet用于医学图像分割

方法

状态空间模型（SSM）：提出了一个基于SSM的U形架构模型VM-UNet，用于医学图像分割。

视觉状态空间（VSS）块：引入VSS块作为基础块来捕获广泛的上下文信息。

非对称编码器-解码器结构：构建了一个具有较少卷积层的非对称编码器-解码器结构，以节省计算成本。

创新点

纯SSM-based模型的首次探索：首次探索了纯SSM-based模型在医学图像分割中的潜在应用，建立了该领域中的一个新基线。

性能竞争力：在ISIC17和ISIC18数据集上，VM-UNet在mIoU、DSC、Acc和Sen等指标上均取得了最佳或接近最佳的成绩，显示出强大的竞争力。

计算效率：通过非对称结构设计，VM-UNet在保持性能的同时减少了参数数量和计算负载，具体数据显示，与对称结构相比，参数数量减少了0.1M，计算负载减少了0.24 GFLOPs。

标签：分割,加持,UNet,建模,SSM,不卷,图像,Mamba
From： https://blog.csdn.net/2401_88556812/article/details/144981900

UNET改进61：添加LFE模块|高效长距离注意力网络
本文内容：在不同位置添加LFE模块目录论文简介1.步骤一2.步骤二3.步骤三4.步骤四论文简介最近，基于Transformer的方法在各种视觉任务中取得了令人印象深刻的结果，包括通过利用自注意力（SA）进行特征提取的图像超分辨率（SR）。然而，在大多数现有的基于Transformer的模型中，SA......
无线鼠标新潮流：无线充电底座加持的未来趋势
在当今这个科技飞速发展的时代，数码产品的迭代日新月异，无线鼠标作为电脑操作不可或缺的外设，也正悄然迈向一个全新的发展阶段——带有无线充电底座的无线鼠标将成为未来的主流趋势。从便捷性角度来看，传统无线鼠标往往依赖于干电池或内置可充电电池，使用干电池不仅成本较高，还需要频......
基于UNet的卫星图像新增建筑检测
文章目录介绍背景目录结构准备数据图像预处理手工标注数据增强网络训练改进U-NetF1Score加权损失函数后处理关于代码总结介绍背景在监管地上建筑物的建设、拆除、改建和扩建是一项重要任务。随着高分辨率卫星图像技术的发展以及智能算法的应用，这些工作可以实现......
用老爷机还能玩吃鸡游戏吗？加持ToDesk云电脑低配置丝滑秒变显卡4070
随着当代人工作、生活压力的增大以及数码科技的发展进步，网络游戏、手机游戏，在年轻人常做的休闲事项中占据了越来越多、越来越重的位置。然而有些游戏，例如吃鸡、竞技类游戏是极为消耗设备配置的，虽然刺激，却也不是任何手机、电脑都能轻松带动并拥有满意的操作效果，如果卡顿、画面......
B端登陆页不卷3D氛围图，都感觉拿不上台面了。
如今在B端登录页的设计上，似乎陷入了“3D氛围图”的内卷怪圈。不少开发者觉得要是没张酷炫的3D氛围图，页面就显得不够档次。确实，3D氛围图能营造出很强的科技感与沉浸感，瞬间抓住用户眼球，提升页面格调。但这也导致大家过于依赖它，而可能忽略了登录页核心的功能展示、操作便......
2024最新工具分享 | 24年最新AWVS/Acunetix Premium V24.8高级版漏洞扫描器(最新版)Wi
前言AcunetixPremium是一种Web应用程序安全解决方案，用于管理多个网站、Web应用程序和API的安全。集成功能允许您自动化DevOps和问题管理基础架构。AcunetixPremium：全面的Web应用程序安全解决方案Web应用程序对于企业和组织与客户、合作伙伴和员工的联系至关......
【深度学习语义分割】U型网络UNet和双边语义分割网络BiSeNet哪种在滑坡分割中更有优势
【深度学习语义分割】U型网络UNet和双边语义分割网络BiSeNet哪种在滑坡分割中更有优势？为什么？你会如何选择？【深度学习语义分割】U型网络UNet和双边语义分割网络BiSeNet哪种在滑坡分割中更有优势？为什么？你会如何选择？文章目录【深度学习语义分割】U型网络UNet和双边语义分......
如何实现跨境设备操作？ToDesk远程控制加持全球节点轻松搞定
随着近年来国际化水平的逐步提高，跨境的学习、交流、工作、旅行等已愈发常见。然而虽然交通出行也算方便，但针对频繁两地往来、海内外人员协助互动等，从省时、省力、省财力精力等成本方面考量，通过来回往返来解决却并非是一个最佳选项。那么，面向例如外资企业远程协助境外同事处理任务......
【项目实战】ISIC 数据集上的实验揭秘：UNet + SENet、Spatial Attention 和 CBAM 的最
“听说有人用UNet找到了CT里的小肿块，也有人用它画了比自己还帅的自拍照。于是我想，UNet这么万能，是不是还能帮我找到我丢的袜子？”别急，这篇文章不会帮你找袜子，但绝对会让你搞懂UNet的精髓！从医学影像到图像分割，UNet堪称卷积神经网络界的全能选手。如果你也是对它一知半解的“......
AI大模型加持，免费多功能，一站式增强/转档！
随着摄影技术的提升，越来越多的人们开始热衷于使用设备来记录生活中的点滴。从手机到专业相机，都能轻松捕捉到美好的瞬间。但由于不同设备和画质的差异，这些影像资料的质量和效果常常参差不齐。在日常生活中，难免会遇到一些需要进行二次处理的情况，例如将老旧的照片、影像，进行画......

王炸升级！Mamba加持UNet，能发高区还不卷

2024深度学习发论文&模型涨点之——Mamba+UNet

相关文章

赞助商

阅读排行