首页 > 其他分享 >编码基础

编码基础

时间:2023-06-19 22:22:26浏览次数:42  
标签:编码 预测 插值 基础 失真 像素 像素点

一、DPCM

DPCM编码是一种信号编码器,它以脉冲编码调制(PCM)为基础,基于信号样本的预测添加了一些功能。DPCM的输入信号可以是模拟信号,也可以是数字信号。

编码器

原始图像输入xk,与预测的xk_hat相减得到残差ek,将残差ek进行量化得到量化编码ek_hat,ek_hat与上一帧预测的图像相加得到预测图像xk’,延时后xk’作为上一帧图片的预测结果。

 

解码器

量化误差ek_hat与预测图像xk_hat结合恢复图像xk

 二、帧间预测

帧间预测是指当前图像中待编码块从邻近已编码图像中预测得到参考块的过程,目的是去除视频信号的时间冗余。帧间预测示意图如图所示,当前帧中待编码块在参考帧中根据块匹配准则搜索得到最佳匹配块。

 1.块匹配

视频编码中常用的块匹配准则有最小均方误差(Mean Square Error, MSE)和绝对误差和(Sum of Absolute Difference, SAD)等匹配准则。MSE匹配准则和SAD匹配准则如下所示,

 其中,MxN表示预测块大小,fi,和 fi=1分别表示当前帧和参考帧像素,(x,y)表示运动向量。SAD块匹配准则没有乘法,计算更为简单,广泛被各种视频编码标准所采用。

2.帧间预测

HEVC帧间预测单元PU有8种划分方式,包括4种对称划分方式: 2Nx2N、2NxN、Nx2N、NxN,以及4种非对称划分方式: 2NxnU、2NxnD、nLx2N、nRx2N。PU是帧间预测过程的基本单元,每个PU通过帧间预测获得一组运动信息,并通过显式或隐式方式对PU的运动信息进行编码。

帧间预测模式主要包括Inter模式、Merge模式和Skip模式

Inter 模式需要对预测块进行帧间运动搜索,获得最佳匹配块所对应的运动信息,然后编码运动信息和预测残差信息;

Merge模式不需要进行帧间运动搜索,直接使用空域和时域已编码邻块的运动信息,并且只需编码相应的使用索引和预测残差信息;

Skip 模式可认为是一种特殊的Merge模式,Skip模式所对应的PU划分方式为2Nx2N。并且,利用Skip模式进行帧间预测的PU,只需编码邻块运动信息的使用索引,不需要编码预测残差信息,解码时直接用预测像素值作为重建像素值

帧间亚像素精度运动估计

预测块PB利用运动向量在相应的参考帧中获得预测像素值,实际情况下,物体并不总是在整像素位置上移动,即运动向量不一定都是整像素值。因此,对非整像素运动情况,需要进行亚像素精度插值,以提高帧间预测精度。HEVC支持亮度分量1/4像素精度运动估计,色度分量(采样格式为4:2:0)1/8像素精度运动估计。

HEVC中亮度分量亚像素精度插值对于1/4像素位置和1/2像素位置采用两个不同的插值滤波器。在1/4像素位置采用的是一个7抽头滤波器,而在1/2像素位置采用的是一个8抽头滤波器。HEVC亮度分量亚像素插值滤波器的抽头系数见表。

 

 下面结合图2-10来对亮度分量亚像素插值过程作简单说明。图2-10中大、小写字母分别对应亮度分量整像素点和亚像素点位置。亮度分量亚像素插值主要分两步进行:

第一步,如图2-10,利用整像素A,,采用相应的抽头滤波器对整像素所在行或列的亚像素进行插值。图2-10中的亚像素点 a0,0 、 b0,0 和 c0,0 利用水平方向整像素点插值得到, d0,0 、 ℎ0,0 和 n0,0 利用垂直方向整像素点插值得到。以水平方向1/2 像素点 b0,0 和垂直方向1/4 像素点 d0,0 为例进行插值,插值计算分别由公式(2-4)和公式(2-5)给出,

 第二步,对其余不在整像素行或列上的亚像素进行垂直方向插值,插值样本来.源于第一步插值得到的亚像素。

 HEVC 色度分量亚像素精度插值过程与亮度分量插值过程类似,也是先对整像素行和列的亚像素点进行插值,再对其余亚像素点进行插值。具体计算过程可参考亮度亚像素插值计算过程,在此不再赘述,仅给出色度插值滤波器抽头系数表2-2。

 通过亮度和色度插值滤波器抽头系数表和亮度分量亚像素插值公式(2-4)~(2-8)可知,经插值后的亚像素值放大了64倍,这样做可提高插值精度。在帧间预测后续过程,放大后的亚像素值需要还原。

三、率失真函数

 

失真函数:假如某一信源X,经过有失真的信源编码器,输出Y。如果xi = yj,则认为没有失真;否则就产生了失真。失真单独大小,用失真函数来表示,衡量用yj代替xi所引起的失真程度。

平均失真:失真函数的数学期望D ‾ 。是信源和信道组成的通信系统的平均失真度。 

 

信源编码器的目的是使编码后所需的信息传输率R尽量小。然而R越小,造成的平均失真越大。给出一个失真的上限值D,在满足平均失真D ‾ ≤D的条件下,选择一种编码方法使得信息率R尽可能小。

信息率失真函数R(D):由前可知:当p ( x i )一定时,互信息I II是关于p ( y j / x i )的U性凸函数,存在极小值。因而在上述满足保真度准则的所有信道中,总能找到一个试验信道,使得信息传输率R ( X , Y ) = I ( X ; Y )达到最小值,把这个最小值记为R ( D )

 

这个最小的互信息R ( D )就称为信源X的信息率失真函数。

限失真信源编码定理:设离散无记忆信源X的信息率失真函数R(D),则当信息率R>R(D)时,只要信源序列长度L足够长,一定存在一种编码方法,其译码失真小于或等于D;反之,若R<R(D),无论采用什么样的编码方法,其译码失真必大于D。

四、DCT和DST的区别

H.265/HEVC标准规定,在帧内4x4模式亮度分量残差编码中使用4x4整数DST,而在帧内其他模式、帧间所有模式,以及所有色差分量的残差编码中一律使用整数DCT。这主要是由于帧内预测利用周围已重构块边缘像素预测当前块的方法使得帧内预测残差具有如下特征:距离预测像素越远,预测残差越大。而DST的基函数能够很好的适应这一特征。

“Mode dependent DCT/DST for intra prediction in block-based image/video coding”这篇文献证明了DCT/DST结合的优势,“此前,Han, Saxena & Rose表明,对于水平和垂直模式的内部预测残差,DST是最佳的变换,其性能接近于KLT。在此,我们证明对其他斜向模式也是如此。使用DCT/DST的选择是基于内部预测模式,不需要额外的信号信息或速率-失真搜索。我们的结果表明,DCT/DST方案比DCT在视频序列内部预测方面提供了显著的BD-Rate改进。”

标签:编码,预测,插值,基础,失真,像素,像素点
From: https://www.cnblogs.com/giaogiaogiao/p/17492387.html

相关文章

  • Verilog语法基础
    FPGA语法逻辑值:0:逻辑低电平,条件为假。1:逻辑高电平,条件为真。z:高阻态,无驱动x:未知逻辑电平,这既不是0也不是1,只是一个不稳定的状态。关键字:module:表示模块的开始,后边紧跟模块名,模块名一般跟.v文件一致,模块结束使用endmodule。输入输出信号:input输入、ouput输出、inout输入输......
  • MySQL入门基础知识
    1MySQL基础1.1常用命令启动服务:netstart服务名停止服务:netstop服务名启动MySQL服务器:MySQL【-h主机名-P端口号】-u用户名-p密码查看MySQL版本:MySQL--version或MySQL–V或登录到MySQL服务端使用selectversion();1.2语法规范每条命令最好用分号结尾每条......
  • python基础 | python中为什么没有自增运算符?
    学过Java或者C语言的同学在使用python时发现之前很方便的自增运算在python中无法使用,要想弄清楚这个问题,首先需要明白什么是自增运算符?自增运算符:自增运算符的作用是在运算结束前将变量的值加1。自增运算符一般存在于C/C++/C#/Java等高级语言中。自增运算是在该数字原来的内存地......
  • docker基础
    docker: 开源的应用容器引擎.可以给应用和应用需要的环境移植到linux机器上.版本:CE社区版本 EE企业版本,收费的安装docket//1.yum包更新到最新版本yumupdate//2.安装需要的软件包,yum-utils提供yum-config-manager功能,另外2个是devicemapper驱动功能yumin......
  • 一些计算机基础知识的考试复习题
    2013Excel里用AND在开头连接多个条件。立即寻址访问速度最快。直接寻址方式下,操作数在内存中,指令中给出操作数的地址,需要再访问一次内存来得到操作数。立即寻址方式下,操作数在指令中,所以在取得指令时就得到操作数,是速度最快的。寄存器寻址方式下,操作数在CPU的寄存器......
  • Git基础、Git指针、Git分支、Git标签
    什么是Git:它是一个分布式版本控制系统,支持断网操作,每个开发者都是一个仓库的完整克隆,每个人都是服务器         为什么要使用Git:它可以有效、高速的处理从很小到非常大的项目版本控制1.Git安装:   yum-yinstallgit  #使用yum安装Git           ......
  • 33. 哈夫曼编码
    一、什么是哈夫曼编码  我们可以用哈夫曼树得到哈夫曼编码,即字符集中每个字符作为一个叶子节点,各个字符出现的频率作为节点的权值,根据上述方法构造哈夫曼树。因为哈夫曼树不唯一,因此哈夫曼编码也不唯一。哈夫曼编码广泛用于数据文件的压缩,其压缩效率通常在20%~90%之间。哈夫......
  • 光学成像系统基础 (一)
    基础物理概念辐射学与色度学对比一、辐射学1.辐射通量辐射通量又称辐射功率,指单位时间内通过某一截面的辐射能,是以辐射形式发射、传播或接收的功率,单位为W(瓦),即1W=J/s(焦耳每秒)。它也是辐射能随时间的变化率Φ=dQ/dt。测量辐射通量的方法一般是由直流电置换辐射通量的等价置换......
  • 数据库信息速递 数据库基础设施已经不在青睐 ETL (译)
    。企业是7天24小时运营的。这包括从网站、后勤办公、供应链到其他所有方面。曾经,一切都是分批次进行的。就在几年前,操作系统会暂停,以便将数据加载到数据仓库并运行报告。现在的报告关注的是事情当前的状况。已没有时间进行ETL。许多IT架构仍然基于中心轮辐式系统。操作系统向数据仓......
  • 自动化测试理论基础
    现如今身处测试行业尤其是进行功能测试的小伙伴,点点点成为其工作中的唯一,不知道自已应该做什么,职业发展也变得非常迷茫。如何打破现有的局面?互联网上有很多规划发展方向的文章,但是无论选择哪一个方向都离不开技术,技术型方向是最实在、最佳的选择,所以自动化测试技术也就成为......