论文阅读：NAFNet

时间：2022-10-19 22:05:01浏览次数：46

标签：GELU 复杂度论文 NAFNet 块间阅读 CA GLU

Simple Baselines for Image Restoration (ECCV2022)

论文：https://arxiv.org/pdf/2204.04676v4.pdf

代码：https://github.com/megvii-research/NAFNet

论文的动机：随着深度学习的发展，模型的复杂度快速上升。是否可以只使用简单的模型，通过较小的复杂度来实现好的效果。

主要思想：作者认为模型复杂度主要包括块间复杂度和块内复杂度。因此通过降低块间复杂度和块内复杂度来构建简单的模型，验证在较低的计算量上能够取得更好的效果。

块间复杂度表示为网络的主要结构，为了降低块间复杂度，采用了简单的Unet为块间结构。论文中提出块间结构不是影响模型效果的关键。

为了降低块内复杂度，主要进行了三处改进：

1）Normalization。采用transformer中经常被使用的LayerNorm。而没有使用BatchNorm，因为小批量可能会带来不稳定的统计数据，不利于对图像细节的恢复。

2）激活层。因为ReLU广泛用于计算机视觉，在SOTA方法中又逐渐被GELU替代。并引入了GLU对GELU进行简化。认为GELU是GLU的一种特殊情况。

　　GLU：

　　GELU：

因此提出：GLU可以被视为激活函数的泛化，它可能能够取代非线性激活函数。GLU本身包含非线性，不依赖于σ。为了降低计算量，移除σ提出了一个简单的GLU变体：直接将特征图分为通道维度中的两部分，并将其相乘。

　　SimpleGate：

对于通道注意模块中的Sigmoid和ReLU：

　　普通的CA：

　　简化：

因此CA也可视为GLU的一个特例。在保留CA的两个最重要的作用：聚合全局信息和通道信息交互。提出了简化的CA：

经过简化后，网络中没有非线性激活函数。所以叫NAFNet：非线性无激活网络。但是不影响性能。

3）注意力。SimpleGate操作虽然可以有效减少计算量，但是丢失了channel-wise的操作，因此在attention上，使用了简化的channel attention。

基于以上改进提出了新的baseline：

论文值得学习的地方：没有直接拿transformer来用，而是将里面比较成熟的模块和机制引入到conv，在简单的模型上进行改进，既能提高性能，又能有效的降低计算量，并且能通过丰富的尝试来验证各个模块的有效性。

标签：GELU,复杂度,论文,NAFNet,块间,阅读,CA,GLU
From： https://www.cnblogs.com/kyzh-lhl/p/16807959.html

《Dual Attention Network for Scene Segmentation》论文笔记
论文题目：《DualAttentionNetworkforSceneSegmentation》论文作者：JunFu,JingLiu,HaijieTian,and etal.论文发表年份：2019模型简称：DANet发表会议：CVPRAb......
#打卡不停更#【ELT.ZIP】啃论文俱乐部——统计压缩编码机理分析
本文出自ELT.ZIP团队，ELT<=>Elite(精英)，.ZIP为压缩格式，ELT.ZIP即压缩精英。成员：上海工程技术大学大三学生合肥师范学院大三学生成都信息工程大学大二学生黑龙江大......
论文解读（GGD）《Rethinking and Scaling Up Graph Contrastive Learning: An Extremely
论文信息论文标题：RethinkingandScalingUpGraphContrastiveLearning:AnExtremelyEfficientApproachwithGroupDiscrimination论文作者：YizhenZheng,ShiruiP......
Image Segmentation Using Text and Image Prompts论文阅读笔记
ImageSegmentationUsingTextandImagePrompts论文阅读笔记摘要对于传统的分割方法，训练好后如果需要纳入新的类别，带来的成本是很高的。因此作者提出了一个系统，可以在......
【自然语言处理（NLP）】基于SQuAD的机器阅读理解
【自然语言处理（NLP）】基于SQuAD的机器阅读理解作者简介：在校大学生一枚，华为云享专家，阿里云专家博主，腾云先锋（TDP）成员，云曦智划项目总负责人，全国高等学校计算机教学与产业实践......
论文笔记 - Noisy Channel Language Model Prompting for Few-Shot Text Classificati
Direct&&NoiseChannel进一步把语言模型推理的模式分为了：直推模式（Direct）；噪声通道模式（Noisechannel）。直观来看：Direct模式NoiseChannel模式也就是说把数据......
CVPR2021 最新出炉的最佳paper，陆续更新中...（附论文地址）
计算机视觉研究院专栏作者：Edison_G今年的CVPR也陆续被大家熟知，录取的paper也公布出来，大家有兴趣的可以深入了解自己感兴趣的领域。作为计算机视觉领域三大顶会之一，CVPR2021......
更丰富的卷积特征用于目标边缘检测（文末附有论文及源码下载）
作者：Edison_G边缘检测是计算机视觉中的一个基本问题。近年来，卷积神经网络(CNNs)的出现极大地推动了这一领域的发展。现有的方法采用特定的深层CNN，但由于尺度和纵横比的变化，......
【论文阅读】FCOS: Fully Convolutional One-Stage Object Detection
原始题目：FCOS:FullyConvolutionalOne-StageObjectDetection中文翻译：FCOS:全卷积One-Stage目标检测发表时间：2019年4月2日平台：arXiv来源：澳大利亚阿德莱德大学......
计算机视觉研究院：近期目标检测框架爱回顾&总结（附论文、源码、链接）
计算机视觉研究院专栏作者：Edison_G最近我们“计算机视觉研究院”主要推送了目标检测干货及Yolo系列的高质量文章及实践，今天给大家总结一下！目标检测是现在最热门的研究课题，也......

论文阅读：NAFNet

相关文章

赞助商

阅读排行