首页 > 其他分享 >A Deformable Attention Network for High-Resolution Remote Sensing Images Semantic Segmentation可变形注意力

A Deformable Attention Network for High-Resolution Remote Sensing Images Semantic Segmentation可变形注意力

时间:2023-12-18 19:13:52浏览次数:29  
标签:采样 Segmentation Remote Network 尺度 信息 像素 Delta 注意力

A Deformable Attention Network for High-Resolution Remote Sensing Images Semantic Segmentation

* Authors: [[Renxiang Zuo]], [[Guangyun Zhang]], [[Rongting Zhang]], [[Xiuping Jia]]


初读印象

comment:: (MDANet)提出了可变形注意力,结合了稀疏空间采样策略和长程关系建模能力。

动机

高分辨率遥感图像的特点:

  1. 由于成像特点,它们往往呈现出冗余和噪声的地物细节。

  2. HRRS图像中的多个地物由于类内方差高(例如,低矮植被和树木)、类间可分性低(例如,建筑)而难以区分。

  3. 多地物阴影和多尺度现象增加了空间扰动的多样性。

  4. 人类视觉系统human visual system (HVS)只降注意力分配给图像中感兴趣的区域。一个简单的理解是,HVS将计算资源分配给最有价值和信息的特征区域。例如,当快速扫描整幅HRRS图像时,人类自动观察整体空间结构,关注任务相关区域的最有效信息,抑制其他冗余信息。在HVS的指导下,最近的DL模型对HVS进行编码,允许网络通过成对交互灵活地将有限的计算资源控制到与任务最相关的信息,而不管空间距离如何。

  5. 自注意力机制通过对输入信号进行两两点积来学习权重,然后用相应的权重对所有信号求和。然而,自注意力机制存在两个局限性。

    1. 内存限制:注意力机制的原理是获取任意两个像素之间的相似度矩阵。然而,语义分割任务需要在像素级别进行密集预测。不可接受的\(O(n^2)\)内存和计算复杂度抑制了在HRRS图像上直接建模全局关系。
    2. 局部不敏感:对于HRRS图像,很自然地,相邻的空间像素通常是高度相关的,大部分依赖关系与像素的附近邻域有关。然而,自注意力对局部上下文不敏感,并且可能由于加权和操作而分散注意力权重。该现象导致感兴趣的范围超出了物体的边界,带来了嘈杂的注意力权重。因此,有效地结合全局和局部信息可能更有效。
  6. 特征提取存在较为普遍的多尺度现象。多尺度现象概括了来自多个层次的对象和特征的尺度显著变化。不同的物体在不同类别之间和相同类别之间以各种尺度和不规则形状奇特地呈现。此外,冗余的物体细节(例如,建筑物阴影和树枝)导致复杂的边界。具有大尺度变化的复杂物体的多尺度现象可能导致仅依靠单一大小的固定感受野来区分各种目标物体的挑战。具体来说,过大的感受野会引入大量无关信息,且对小物体不可见。相比之下,过小的感受野会忽略像素之间的全局关系。因此,需要捕获多尺度表示,以实现准确和鲁棒的视觉识别。

方法

可变形空间注意力

提出了一个新的模块,使网络能够聚焦于任意参考像素周围的一组高度相关的小像素。新模块背后的直觉类似于空间自相关的原理,即假设距离较近的像素比距离较远的像素更相似。通过学习目标像素附近像素的特征,来加强目标像素的上下文表达能力。

Pasted image 20230212155512模块的输入输出尺寸一致,DAM可以嵌入在任意网络层。#### 空间采样部分
为每个像素计算K个带偏移量的近邻。
像素\(p_q\)处于位置\((x,y)\),有内容\(p_q(x,y)\in R^{1\times 1\times C}\)。每个像素的偏移\((\Delta p_x, \Delta p_y)\)通过输出通道为2的\(1\times 1\)卷积层得到。

Pasted image 20230212150228

  1. 对于该像素的k个近邻,则用k个\(1\times 1\)卷积产生k个\((\Delta p_x, \Delta p_y)\),其集合\((\Delta P_x, \Delta P_y)=(p_q(x,y)w^k _x,p_q(x,y)w^k _y)^K _{k=1}\),第k个\((w^k _x, w^k _y)\)产生第k组偏移量。

  2. 通过偏移量获得不规则采样点(以其中一个为例)
    Pasted image 20230212151719

  3. 由于偏移量为小数,因此通过非线性插值获得具体值。其中\((x_k , y_k)\)表示任意位置,\(τ\)枚举输入特征图中\(p_q\)附近的所有整数空间位置团,线性插值核G( · , ·)在x和y方向上进行分解。
    Pasted image 20230212151823

  4. 然后,将k个相邻采样像素进行拼接,生成对应的采样特征图\(S∈R^{K × C。}\)
    空间采样模块可以自动适应对象的几何变化,并对每个像素的重要局部结构进行编码。然而,单独的1 × 1 × C卷积不考虑相邻像素之间的信息交互,得到只对输入敏感的二维空间偏移。为此,引入注意力模块来建模参考像素与对应采样像素之间的相互作用。

空间分布函数

二维空间采样模块提取的像素包含更多关于各种几何变换的信息。此外,还集成了空间注意力模块来提取和表达参考像素和采样像素之间的依赖关系。
将原像素\(p_q\)转换为Q,将采样得到的像素\(p_k\)转换为K和V,得到相容性矩阵
Pasted image 20230212154315####细粒度融合
为了有选择地聚合上下文并在全局视图中保留更多的语义信息,我们通过将所有采样像素\(p_v\)与相应的注意力权重\(A_{qk}\)相加来提取上下文信息。最后,将上下文信息与原始参考像素相结合,保留一定的初始特征。

Pasted image 20230212154652

其中α是尺度参数,在训练过程中从0逐渐增加。
通过分布功能模块和细粒度融合模块,使得采样像素和对应的参考像素能够更好地交互,具有更准确的特征表示。

MDANet

基于提出的DAM,设计了一个MDANet。在MDANet中,DAM被嵌入到ResNet50网络的不同层以捕获详细的位置信息和抽象的语义信息。不同层中的跳跃连接可以提取多尺度特征信息以获得细节特征信息,表征不同尺度下的物体。
Pasted image 20230212155620###表现

Pasted image 20230212161121

启发

偏移点可以不从目标点附近出发,从目标点出发,可以随意采样多个点当作变形点。

标签:采样,Segmentation,Remote,Network,尺度,信息,像素,Delta,注意力
From: https://www.cnblogs.com/tifuhong/p/17909254.html

相关文章

  • Object Tracking Network Based on Deformable Attention Mechanism
    ObjectTrackingNetworkBasedonDeformableAttentionMechanismLocallibrary初读印象comment::(DeTrack)采用基于可变形注意力机制的编码器模块和基于自注意力机制的编码器模块相结合的方式进行特征交互。基于可变形注意力机制的编码器可以在不聚焦所有像素的情况下精......
  • Remote Dictionary Server
    Redis7.0源码环境搭建与阅读技巧 天下武功,无坚不摧,唯快不破!我的名字叫Redis,全称是RemoteDictionaryServer。有人说,组CP,除了要了解她外,还要给机会让她了解你。那么,作为开发工程师的你,是否愿意认真阅读此心法抓住机会来了解我,运用到你的系统中提升性能。我遵守BSD......
  • SiReN Sign-Aware Recommendation Using Graph Neural Networks论文阅读笔记
    Abstract目前使用GNN的推荐系统主要利用高评分的正向用户-物品交互信息。但是如何利用低评分来表示用户的偏好是一个挑战,因为低评分仍然可以提供有用的信息。所以在本文中提出了基于GNN模型的有符号感知推荐系统SiReN,SiReN有三个关键组件构造一个符号二部图更精确的表示用户的......
  • Fully Attentional Network for Semantic Segmentation:FLANet
    FullyAttentionalNetworkforSemanticSegmentation*Authors:[[QiSong]],[[JieLi]],[[ChenghongLi]],[[HaoGuo]],[[RuiHuang]]初读印象comment::(FLANet)常规的注意力在得到相容性矩阵的时候,把会有一个维度被压缩掉。为了解决这个问题,本文提出了一种新的方法,即......
  • Segmentation Transformer: Object-Contextual Representations for Semantic Segment
    SegmentationTransformer:Object-ContextualRepresentationsforSemanticSegmentation*Authors:[[YuhuiYuan]],[[XiaokangChen]],[[XilinChen]],[[JingdongWang]]Locallibrary初读印象comment::(OCRnet)聚焦于语义分割中的上下文聚合问题,利用物体类别的表......
  • Object detection in optical remote sensing images: A survey and a new benchmark
    Objectdetectioninopticalremotesensingimages:Asurveyandanewbenchmark光学遥感图像中的目标检测:调查和新基准最近人们投入了大量的精力来提出光学遥感图像中物体检测的各种方法。然而,目前对光学遥感图像中目标检测的数据集和基于深度学习的方法的调查还不够。此外......
  • 【Linux】调试常见的应用程序奔溃“Segmentation fault (core dumped)”
    https://blog.csdn.net/hello_nofail/article/details/129994481?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522170264661316800227454508%2522%252C%2522scm%2522%253A%252220140713.130102334.pc%255Fall.%2522%257D&request_id=170264661316800227454508&......
  • Machine is not on the network
     在调试Androidjni的时候发现一个奇怪的问题 在连接socket的时候老是报错m_sock=socket(AF_INET,SOCK_STREAM,0);if(m_sock<0){debug(LEVEL_ERROR,"Socketcreateerror%d\r\n",errno);return-1;} 报错  Socketc......
  • 使用yarn安装依赖包出现“There appears to be trouble with your network connection
    我们在使用yarn安装依赖包文件的时候,可能会出现“Thereappearstobetroublewithyournetworkconnection.Retrying...”超时的提醒,很有可能是因为yarn默认的镜像地址为国外,因此慢(超时)就说得过去了……1、......
  • 0x02 Network Services
    Task1、引言这个房间将探讨常见的网络服务漏洞和错误配置。Task2、了解SMB什么是SMB?SMB-服务器消息块协议-是一种客户端-服务器通信协议,用于共享对网络上的文件、打印机、串行端口和其他资源的访问。sourceSMB协议被称为响应请求协议,这意味着它在客户端和服务器之间传输......