【NeurIPS 2022】SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

时间：2022-10-05 19:22:42浏览次数：80

标签：Convolutional Rethinking Segmentation nn dim self attn SegNeXt Conv2d

【NeurIPS 2022】SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

代码：https://github.com/Visual-Attention-Network/SegNeXt

1、研究动机

来自清华大学国孟昊博士的论文，可以理解为大核卷积 large kernel attention 的扩展，该方法是在 Visual Attention Network 这篇论文中提出，思想是：用大核卷积来替换 Transformer 模型中的 attention。 具体如下图所示，一个标准的卷积可以用 depth-wise conv、depth-wise dilation conv、pointwise conv 来替换。图中展示了一个13x13的大核卷积计算非常复杂，可以用一个 5x5 的 DWConv，空洞为3的 DW-Dilated Conv，以及 1x1x13 的点卷积来取代。

请添加图片描述

把这个思想用来改进用于语义分割的 SegFormer ，就是本文所提出的 SegNeXt，效果非常好。

2、方法介绍

SegFormer 是NeurIPS 2021 提出的方法，如下图所示，是一个 encoder-decoder 结构，encoder 部分是标准的 Transformer，decoder 把之前输出的特征拼接，然后利用MLP得到最终输出。

请添加图片描述

本文提出的 SegNeXt，主要改进了两部分：1）encoder 里 Transformer 结构的 attention 使用多尺度卷积注意力替换；2）改进了 decoder 的结构。

SegNeXt 里面应用的 attention 如下图所示，和 LKA 非常类似，只不过中间的 depth-wise dilated conv 替换为三个并行的多尺度条形卷积，分别为 1x7, 1x11, 1x21 。

代码如下：

class AttentionModule(BaseModule):
    def __init__(self, dim):
        super().__init__()
        self.conv0 = nn.Conv2d(dim, dim, 5, padding=2, groups=dim)
        self.conv0_1 = nn.Conv2d(dim, dim, (1, 7), padding=(0, 3), groups=dim)
        self.conv0_2 = nn.Conv2d(dim, dim, (7, 1), padding=(3, 0), groups=dim)
 
        self.conv1_1 = nn.Conv2d(dim, dim, (1, 11), padding=(0, 5), groups=dim)
        self.conv1_2 = nn.Conv2d(dim, dim, (11, 1), padding=(5, 0), groups=dim)
 
        self.conv2_1 = nn.Conv2d(dim, dim, (1, 21), padding=(0, 10), groups=dim)
        self.conv2_2 = nn.Conv2d(dim, dim, (21, 1), padding=(10, 0), groups=dim)
        self.conv3 = nn.Conv2d(dim, dim, 1)
 
    def forward(self, x):
        u = x.clone()
        attn = self.conv0(x)
 
        attn_0 = self.conv0_1(attn)
        attn_0 = self.conv0_2(attn_0)
 
        attn_1 = self.conv1_1(attn)
        attn_1 = self.conv1_2(attn_1)
 
        attn_2 = self.conv2_1(attn)
        attn_2 = self.conv2_2(attn_2)
        attn = attn + attn_0 + attn_1 + attn_2
 
        attn = self.conv3(attn)
 
        return attn * u

decoder 的改进相对较小，如下图所示，stage 1 的特征没有输入。同时，使用 Hamburger 注意力来处理。

实验部分可以参考作进行论文，这里不过多介绍。

标签：Convolutional,Rethinking,Segmentation,nn,dim,self,attn,SegNeXt,Conv2d
From： https://www.cnblogs.com/gaopursuit/p/16756181.html

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION（VGG）阅读笔记（22
VERYDEEPCONVOLUTIONALNETWORKSFORLARGE-SCALEIMAGERECOGNITION（VGG）阅读笔记（22.10.05）摘要：本文研究在大规模图像识别设置中卷积网络深度对其准确性的影响。主要贡献......
Two-Stream Convolutional Networks for Action Recognition in Videos论文精读
Two-StreamConvolutionalNetworksforActionRecognitioninVideos论文精读大家好，今天我要讲的论文是一篇视频理解领域的开山之作，这是2014年发表在NIPS的一篇文章。这......
FCOS3D: Fully Convolutional One-Stage Monocular 3D Object Detection
FCOS3D是在2D检测器FCOS的基础上提出的,是一种单目3D检测算法,根据RGB图像进行3D目标检测.FCOS预测的是一个前景点到边界框的4个距离,而FCOS3D需要预测更多的东西,包括3D中......
[AAAI 2022]Graph Convolutional Networks with Dual Message Passing for Subgraph I
总结GNN实现子图匹配。利用线图（边变点）让模型训练时将点和边的特征反复映射到对方领域参与训练。定义常规符号Graph,Edge,Vertex,。X,Y表示点标签和边标签：\(\mathca......
A Graph Convolutional Network with Adaptive Graph Generation and Channel Selecti
motivation图神经网络已经被证明可以很好的解决长距离的语义依赖。但是之前的方法大多使用固定的图，如依赖于外部解析器生成的图（句法依存图等）图是固定的无法使用梯度......
【C++】Debugging Segmentation Faults
背景linux下的程序，在遇到空指针解引用、栈错误等原因崩溃时，bash会输出一条：Segmentationfault（coredump）如果你看到coredumped字样，并且在目录下也找到了一个叫co......
DropEdge: Towards Deep Graph Convolutional Networks on Node Classification
目录概符号说明本文方法代码RongY.,HuangW.,XuT.andHuangJ.DropEdge:towardsdeepgraphconvolutionalnetworksonnodeclassification.InInternational......
【CVPR2022】LAVT: Language-Aware Vision Transformer for Referring Image Segmenta
【CVPR2022】LAVT:Language-AwareVisionTransformerforReferringImageSegmentation论文地址：https://arxiv.org/abs/2112.02244代码地址：https://github.com/yz93......
Delphi xe 错误：...segmentation fault(11)
Delphixe错误：...segmentationfault(11)错误原因描述：分段故障发生原因：1）一般为输出数据的时候，超出了列表的范围值导致，例如，列表最大值10行，你强行输出11行的数据......

【NeurIPS 2022】SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation

1、研究动机

2、方法介绍

相关文章

赞助商

阅读排行