首页 > 其他分享 >High-Efficiency Lossy Image Coding Through Adaptive Neighborhood Information Aggregation

High-Efficiency Lossy Image Coding Through Adaptive Neighborhood Information Aggregation

时间:2023-12-15 16:13:25浏览次数:32  
标签:Information Neighborhood 函数 Image Coding RNAB 激活 解码

目录

简介

创新点

  • Integrated Convolution and Self-Attention (ICSA) unit
    提出集成卷积和自注意力单元,形成内容自适应变换
  • Multistage Context Model (MCM)
    多阶段的上下文模型,按照预安排的空间通道排序,进行精确的并行概率估计。

得到了比常用方法快60倍的解码速度。

内容

本文关注于图像压缩的变换和熵编码阶段

Entropy Coding Using Multistage Context Model

模型结构

image
感觉是结合了<不均匀通道上下文模型>和< Swin Transformer>两篇文章

残差邻域注意力块Residual Neighborhood Attention Block RNAB

这里的RNAB设计的和Swin里的设计差不多,残差的 normlization层+注意力层+normalization层+MLP
image

激活函数 高斯误差线性单元激活函数GELU

RNAB中用到了激活函数GELU,谷歌的BERT和OpenAI的GPT-2中都用到了该函数
\(G E L U(x)=x \times P(X<=x)=x \times \phi(x), x \sim N(0,1)\)在代码计算时,用\(G E L U(x)=0.5 x\left(1+\tanh \left(\sqrt{2 / \pi}\left(x+0.044715 x^3\right)\right)\right)\)去近似。

并行解码

image
该解码过程也特别想棋盘上下文模型的并行解码。

标签:Information,Neighborhood,函数,Image,Coding,RNAB,激活,解码
From: https://www.cnblogs.com/CLGYPYJ/p/17903574.html

相关文章

  • hive Metastore 启动报错 Version information not found in metastore报错处理
    修改conf/hive-site.xml中的hive.metastore.schema.verification 设置为false。 hive Metastore 启动报错 [main]:MetastoreThriftServerthrewanexception...org.apache.hadoop.hive.metastore.api.MetaException:Versioninformationnotfoundinmetastore......
  • arch 使用appimage
    1.cd进入appimage所在的目录cdyour_folder2.赋予appimage运行权限chmod+xyour_file.appimage3.运行appimage格式文件./your_file.appimage4.可能发现无法运行提示dlopen():errorloadinglibfuse.so.2AppImagesrequireFUSEtorun.Youmightstillbeableto......
  • MacOS-“System Information”这个App用做USB设备的检测与设备文件的确定
    “SystemInformation”这个Apple自带的GUI小App是检测USB硬件的;如图所示;而Linux上是lsusb与lspci这类commandline的command;找到USB硬件的设备信息,需要与设备文件映射,怎么找?`bash-3.2#ls/dev/tty*|sort>sys.txt#连接USB硬件前bash-3.2#ls/dev/tt......
  • SixLabors.ImageSharp 圆角矩形路径代码
    原因因微软抛弃了System.Drawing.Common决定重写绘图底层,在学习绘制时常会用到部分绘图引擎,参考过几个都有缺陷例如:1.SkiaSharp字体布局问题参考布局问题2.opencvsharp不支持中文文字于是乎我就用到了imageSharp,其中看到作者有对于圆角矩形头像的示例代码,但这......
  • 占位图片(Placeholder Image)
    一、引言在网页设计和开发中,占位图片(PlaceholderImage)是一种常见的技术手段,用于在用户上传图片之前或者图片加载失败时,展示一个临时替代的图片,以提高用户体验。本文将详细介绍占位图片的实现原理和实践应用,并通过实例给出不同场景下的解决方案。占位图片生成器|一个覆盖广......
  • 2020CVPR_High-Resolution Image Synthesis with Latent Diffusion Models
    1.AutoEncoderAutoEncoder(自编码器)是一种无监督学习的神经网络模型,用于学习有效的数据表示。它的目标是将输入数据编码成一种潜在的、紧凑的表示形式,然后从这个表示中重构原始输入。自编码器由两部分组成:编码器(Encoder)和解码器(Decoder)。编码器(Encoder):将输入数据映射到潜在表示空......
  • The Devil Is in the Details: Window-based Attention for Image Compression
    目录简介简介基于CNN的模型的一个主要缺点是cNN结构不是为捕捉局部冗余而设计的,尤其是非重复纹理,这严重影响了重建质量。受视觉转换器(ViT)和SwinTransformer最新进展的启发,我们发现将局部感知注意机制与全局相关特征学习相结合可以满足图像压缩的期望。介绍了一种更简单有效......
  • 【愚公系列】2023年12月 通用职责分配原则(一)-信息专家原则(Information Expert Prin
    ......
  • Hadoop NameNode(SecondaryNameNode) Fsimage和Edits解析
    NameNode被格式化之后,将在NameNode目录下产生一些文件1.Fsimage文件Fsimage文件是HDFS文件系统元数据的一个永久性的检查点,其中包含HDFS文件系统的所有目录和文件inode的序列化信息1.查看Fsimage文件1.oiv命令hdfsoiv-p文件类型-i镜像文件-o转换后文件的输出路径hdfs......
  • BIIP 生物信息学与智能信息处理**年学术会议(BIIP20XX)Bioinformatics and Intelligen
    生物信息学与智能信息处理2023学术年会举行发布日期:2023年06月25日14:01 点击次数:1038[本站讯]近日,中国人工智能学会生物信息学与人工生命专业委员会生物信息学与智能信息处理2023学术年会(BIIP2023)在济南举行。中国科学院院士、天津大学教授元英进出席会议。山东大学副校长......