首页 > 其他分享 >CARAFE: Content-Aware ReAssembly of FEatures 可学习的上采样

CARAFE: Content-Aware ReAssembly of FEatures 可学习的上采样

时间:2023-12-18 19:25:51浏览次数:28  
标签:采样 ReAssembly FEatures 重组 位置 up times CARAFE Aware

CARAFE: Content-Aware ReAssembly of FEatures

* Authors: [[Jiaqi Wang]], [[Kai Chen]], [[Rui Xu]], [[Ziwei Liu]], [[Chen Change Loy]], [[Dahua Lin]]


初读印象

comment:: (CARAFE)提出了一种新的上采样方法。

动机

特征上采样是深度神经网络中最基本的操作之一。
过去方法:

  1. 最近邻和双线性插值:仅考虑了亚像素邻域,未能捕捉密集预测任务所需的丰富语义信息。
  2. 反卷积:反卷积算子在整幅图像中应用相同的核,而不考虑内容,这限制了其应对局部变异的能力。参数量和计算量大。

方法

提出了内容感知的特征重组CARAFE,有以下优点

  1. 大感受野:不同于以往仅利用亚像素邻域的工作(例如双线性插值),CARAFE可以在较大的感受野内聚合上下文信息。
  2. 内容感知处理:CARAFE不对所有样本使用固定的内核(例如反卷积),而是支持特定于实例的内容感知处理,从而实时生成自适应的内核。
  3. 轻量、快速计算。

内容感知的特征重组

Pasted image 20230113171311

给定一个大小为\(C × H × W\)的特征图\(X\)和一个上采样比率\(σ\) (假设\(σ\)是一个整数),CARAFE将产生一个新的大小为\(C × σH × σ W\)的特征图\(X'\)。
对于输出X′的任意目标位置\(l'=(i', j')\),在输入\(X\)处有相应的源位置\(l = ( i , j)\),其中\(i = [i'/ σ],j = [j'/ σ]\)。用\(N(X_l, k)\)来代指\(X\)中以位置\(l\)为中心的\(k×k\)子区域。

  1. 根据每个目标位置的内容预测一个重组核:预测核模块\(ψ\)根据\(X_l\)的近邻预测每个位置\(l'\)的位置核\(W_{l'}\)。
    Pasted image 20230113160357

  2. 用预测的核对特征进行重组:\(φ\)是内容感知的重组模块,它将\(X_l\)的邻居与内核\(W_{l'}\)进行重组。
    Pasted image 20230113160513

Kernel Prediction Module

目标:\(X\)中一个位置对应\(X'\)中\(σ^2\)个位置,每个目标位置要一个\(k_{up}\times k_{up}\)大小的核,所以该模块最终生成的核大小为\(C_{up}*H \times W\),其中\(C_{up}=σ^2{k_{up}}^2\)。
有三个部分:

  1. 通道压缩器减少了输入特征图的通道。
  2. 内容编码器将压缩后的特征图作为输入,对内容进行编码,生成重组核。
  3. 核正规化器对每个重组核应用一个softmax函数。
Channel Compressor

使用\(1\times 1\)卷积将维度压缩到\(C_m\)

Content Encoder

使用输入通道为\(C_m\),输出通道为\(C_{up}\),大小为\(k_{encoder}\times k_{encoder}\)的卷积核,经验公式\(k_{encoder}=k_{up}-2\)。得到的特征图的大小为\(C_{up}\times H\times W\)

Kernel Normalizer

Pasted image 20230113172542

\(C_{up}\)个通道分为\(σ^2\)个块,块有\(k_{up}^2\)层。将这\(σ^2\)个块进行重排列,得到\(σH\times σW\)大小的特征图,通道数为\(k_{up}^2\),位置\(l'=(i',j')\)上的\(k_{up}^2\)个数就是对应\(X'\)中\(l'\)位置的重组核。
对每一个\(k_{up}\times k_{up}\)大小的重组核,使用softmax对其正则化,归一化步骤迫使核值之和为1,这是一个跨越局部区域的软选择。

Content-aware Reassembly Module

4f7432e9787d36f362891086fd6e89a

对\(X'\)中每个点使用相应的重组核进行权重聚合
Pasted image 20230113180407

启发

带权重的上采样,还展示了在目标内容不变的情况下,如何生成不同的权重以产生不同的值。

标签:采样,ReAssembly,FEatures,重组,位置,up,times,CARAFE,Aware
From: https://www.cnblogs.com/tifuhong/p/17909230.html

相关文章

  • Null-Aware 问题对 TiDB 优化器的影响(OOM)
    作者:jansu-dev第一章背景介绍笛卡尔积在TiDB执行计划中经常出现,该类执行计划又极其消耗数据库资源,容易引发执行速度慢,消耗大量内存,甚至引发OOM的情况。**本文将着重研究因TiDB对NULLAware的不完全支持,导致的笛卡尔积情况,期望对后续数据库问题分析提供参考,及自己更......
  • SiReN Sign-Aware Recommendation Using Graph Neural Networks论文阅读笔记
    Abstract目前使用GNN的推荐系统主要利用高评分的正向用户-物品交互信息。但是如何利用低评分来表示用户的偏好是一个挑战,因为低评分仍然可以提供有用的信息。所以在本文中提出了基于GNN模型的有符号感知推荐系统SiReN,SiReN有三个关键组件构造一个符号二部图更精确的表示用户的......
  • select_shape 中features参数解析
    Halcon算子select_shape-借助形状特征选择区域(选择轮廓)select_shape- 借助形状特征选择区域。原型:1select_shape(Regions:SelectedRegions:Features,Operation,Min,Max:)(将连接的区域进行筛选,筛选的特征有很多,如面积长度等,可以去掉不满足条件......
  • 11.Demonstrate the essentials concerning "Abstract" in research papers,such as f
    11.Demonstratetheessentialsconcerning"Abstract"inresearchpapers,suchasfeatures,types,andcomponents.演示研究论文中关于“摘要”的要点,如特点、类型和组成部分。Round1:IntroductiontotheAbstractSpeaker1(ResearcherA):Ladiesandgentlemen,than......
  • ApplicationContextAware 理解
    ApplicationContextAware理解-长弓射大狗-博客园(cnblogs.com) 我们常用的IOC容器是ApplicationContext,她的顶层接口是BeanFactory, ApplicationContext对BeanFactory进行了扩展。我们拿到IOC容器的方式有3种,使用ApplicationContext接口下的三个实现类:ClassP......
  • 【论文阅读笔记】【Image Retrieval】 Global Features are All You Need for Image R
    SuperGlobalICCV2023读论文思考的问题论文试图解决什么问题?图片检索方法通常由粗粒度图片检索和精确的结果重排列两个模块组成。人们通常认为图片的localfeature在结果重排列中是不可或缺的,但对大量的localfeature的计算需要较高的计算资源和时间能否只用图片......
  • 浅析Spring IoC源码(八)了解BeanFactoryAware
    这一节我们还是先了解一下BeanFactoryAware这个接口,之所以说只是了解一下,还是希望等到分析refresh()的时候有个更好的理解吧照旧先上源代码:官方解释:实现这个接口的bean其实是希望知道自己属于哪一个beanfactory言简意赅,不需要做多解释,先实现一下自己,看看他的基本功能吧,看代码:MyBean......
  • 珠海全志关于DDR3的Power-aware的信号完整性仿真研究
    CadenceSigrityPower-awareSI工具包介绍Power-awareSI工具包是Cadence公司针对源同步并行总线如DDR3、DDR4等所提供的完整的仿真解决方案。基于行业领先的Sigrity专利技术,Power-awareSI工具包可以快速、精确提取封装和PCB的信号布线和电源分布系统的网络参数,然后......
  • 论文阅读:Local and Global Structure for Urban ALS Point Cloud Semantic Segmentati
    LocalandGlobalStructureforUrbanALSPoint CloudSemanticSegmentationWith Ground-AwareAttention利用地面感知注意力对城市ALS点云进行局部和全局结构的语义分割摘要机载激光扫描(ALS)点云的解释在地理信息生产中起着显著的作用。作为解释的关键步骤,准确的语义分割可以......
  • Opencv中goodFeaturesToTrack函数(Harris角点、Shi-Tomasi角点检测)算子速度的进一步
    搜索到某个效果很好的视频去燥的算法,感觉效果比较牛逼,就是速度比较慢,如果能做到实时,那还是很有实用价值的。于是盲目的选择了这个课题,遇到的第一个函数就是角点检测,大概六七年用过C#实现过Harris角点以及SUSAN角点。因此相关的理论还是有所了解的,不过那个时候重点在于实现,对于......