首页 > 其他分享 >VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR

VARIATIONAL IMAGE COMPRESSION WITH A SCALE HYPERPRIOR

时间:2023-11-24 18:02:44浏览次数:38  
标签:表示 编码器 HYPERPRIOR IMAGE 分布 先验 VARIATIONAL hat 模型

abstruct

描述了一个变分自编码器的端到端图像压缩模型。这个模型结合了超先验来捕获潜在表示的空间依赖性,这种超先验涉及到了边信息。并且改模型与底层的自编码器结合联合训练一个复杂的先验。

introduction

熵编码依赖于编码器和解码器都知道的量化表示的先验概率模型(熵模型)。这种压缩潜在表示的熵模型通常表示为联合分布,甚至全因子分布\(p_{\hat y}(\hat y)\)。这里要注意区分潜在表示的实际分布\(m(\hat y)\)和熵模型\(p_{\hat y}(\hat y)\)

  • 熵模型通常被假定具有某种参数形式,参数和数据匹配
  • 边际分布则是一种未知的分布,它既来自于图像的分布,也来自于用来推断替代表示y的方法。
    一对编码器-解码器所能达到的最小平均编码长度由两个分布之间的香农交叉熵给出:

\[R = E_{\hat y}∼m[− log_2 p_{\hat y}(\hat y)] \]

在这里,作者认为,边信息可以被看做是熵模型参数的先验,使他们成为潜表示的超先验。
该文章在Ballé et al. (2017)的基础上,加入了超先验,以捕捉潜在表示的空间相邻元素在尺度上趋于共同变化这一事实

量化会带来误差,这在有损压缩中是可以容忍的,从而产生了速率-失真优化问题。速率是压缩表示法的预期编码长度(比特率):假设熵编码技术能有效运行,这又可以写成交叉熵:
在这种情况下,潜在表示的边际分布来自(未知)图像分布 px 和分析变换的属性。失真度是指重建 x^ 与原始图像 x 之间的预期差异,以规范或感知度量。量化的粗糙度,或者说分析和合成变换所隐含的表示的扭曲,会影响速率和失真度,从而导致权衡,即速率越高,失真度越低

模型

image
如图3所示,为了捕获潜在表示的空间依赖关系,引入了额外的随机变量z。
每个元素\(\tilde y_i\)被建模为具有自身标准差的零均值高斯(标准差是通过对\(\tilde z\)应用参数变换\(h_s\)来预测的)
我们只需要在y的基础上堆叠另一个参数变换\(h_a\)即可以建立一个单联合因子分解变分后验

标签:表示,编码器,HYPERPRIOR,IMAGE,分布,先验,VARIATIONAL,hat,模型
From: https://www.cnblogs.com/CLGYPYJ/p/17853212.html

相关文章

  • HTB Pilgrimage
     nmap扫一下发现80和22端口开放。 改hosts文件访问域名pilgrimage.htb 直接就是一个文件上传,尝试有没有文件上传漏洞。发现无论任何类型的文件,会将所有文件重命名并加上png或jpg后缀,但从从文件上传这个点突破是有点困难的。尝试其他的方法,扫一下这个网站,看看有没有敏感......
  • Joint Autoregressive and Hierarchical Priors for Learned Image Compression
    abstruct最近的图像压缩模型基于自编码器,学习近似可逆的映射(从像素到量化的可逆表示),这些与熵模型(潜在表示的先验)结合,可以与标准算术编码算法一起使用产生压缩比特流。与简单的全因子先验相比,分层熵模型可以利用更多潜变量中的结构,从而在保存端到端优化的同时提高压缩性能。众所周......
  • cxImage1图片显示(17)
    参考:https://www.cnblogs.com/liessay/p/5267221.html1]:   Picture:载入要显示的图片,也可从DEV自带IconLibrary库里选择2]:   Properties->Caption在没有内容的时候显示在图片框中间的文字 3]:   Properties->PopupMenuLayout->MenuItems可选择需要显示在......
  • uniapp使用第三方插件image-tools进行图片转base64
    最近做的这个项目原来是原生android开发的,然后图片上传功能是 前端获取图片->图片转成base64字符串(base64编码)->传递给服务器后端->服务器接受base64字符串数据->获取到的base64转成图片jpg(解码)->存入服务器,并写入数据库后来因为原生安卓太麻烦了,转成了uniapp进行开......
  • 视频直播源码,图片选择器ImagePicker
    视频直播源码,图片选择器ImagePicker引入 gradleallprojects{  repositories{    maven{url'https://jitpack.io'}  }}implementation'com.github.DL-ZhangTeng:ImagePicker:1.5.0'//使用的三方implementation'com.github.bumptech.glide:glide:4.1......
  • 《Deep learning for fine-grained image analysis: A survey》阅读笔记
    论文标题《Deeplearningforfine-grainedimageanalysis:Asurvey》作者魏秀参,旷世研究院初读摘要细粒度图像分析(FGIA)的任务是分析从属类别的视觉对象。细粒度性质引起的类间小变化和类内大变化使其成为一个具有挑战性的问题。本文旨在系统地调查基于深度学习的......
  • Conditional Probability Models for Deep Image Compression
    \(\quad\)在自编码器中使用深度网络已成为有前途的研究方向,这种学习网络有两个挑战:处理量化与控制reconstructionerror(distortion)entropy(rate)ofthelatentimagerepresentation之间的权衡(rate都用熵表示吗?)introduction\(\quad\)训练这种基于网络的压缩方法有一个......
  • (倒推2)E:\mmdetection-main\demo\image_demo.py 代码解读
    #Copyright(c)OpenMMLab.Allrightsreserved."""ImageDemo.Thisscriptadoptsanewinfenenceclass,currentlysupportsimagepath,np.arrayandfolderinputformats,andwillsupportvideoandwebcaminthefuture.Example:Save......
  • Natural Image Reconstruction from fMRI using Deep Learning: A Survey
    NaturalImageReconstructionfromfMRIusingDeepLearning:ASurveyZarinaRakhimberdina1,3,QuentinJodelet1,3,XinLiu2,3,∗,TsuyoshiMurata1,3一句话概括:介绍了各种自然图像重构方法(生成模型和非生成模型)以及评价指标,并提出了综合评价各模型的方法。介绍fMR......
  • 【论文阅读笔记】【Image Retrieval】 Global Features are All You Need for Image R
    SuperGlobalICCV2023读论文思考的问题论文试图解决什么问题?图片检索方法通常由粗粒度图片检索和精确的结果重排列两个模块组成。人们通常认为图片的localfeature在结果重排列中是不可或缺的,但对大量的localfeature的计算需要较高的计算资源和时间能否只用图片......