首页 > 其他分享 >从HEVC到通用视频编码的下一代视频压缩技术

从HEVC到通用视频编码的下一代视频压缩技术

时间:2023-06-13 13:01:40浏览次数:48  
标签:下一代 HEVC 编解码器 视频压缩 AV1 MPEG VVC 我们


从HEVC到通用视频编码的下一代视频压缩技术_复杂度

本文来自于ATEME研究总监兼总监米克尔·劳莱特的主题演讲。他主要分享了MPEG-2、H.264、H.265、H.265、VVC,以及EVC、LCEVC等较新的编解码器。我们需要了解HEVC方面的编解码器授权,以及VVC标准化的过程。在探索的过程中,我们从Intra-coding和Inter-prediction方法等方面对图片分割进行了详细的介绍。在同样的背景下,我们通过VTM的复杂性、VVC的通用性以及它们在未来的编解码器之战中如何与VVC平衡。

文 / Mickaël Raulet

整理 / LiveVideoStack

从HEVC到通用视频编码的下一代视频压缩技术_ide_02

所以,我将介绍从HEVC到VVC,以及今天到来的一些编解码器。

从HEVC到通用视频编码的下一代视频压缩技术_ide_03

首先我先说一下ATEME。ATEME从事一家做广播的编码公司现在已经有20多年了,包括VideoLAN的一些人也在公司里面工作。所有的编解码器,我们一开始主要是从MPEG开始、VVC标准化,然后VVC竞争者,所有的编解码器都在一起攻克。其他的都是同时进行的,更重要的是我今天要讲的这个也是编解码器的未来进展。

从HEVC到通用视频编码的下一代视频压缩技术_ide_04

我们同时是MPEG和ITU的成员,用我们所有的专业知识为它做贡献。但是我们的时间不多,我们主要是在实现编解码器。我们是AOM开放媒体联盟和MC-IF.org的成员,目的是减少我们为HEVC获得的模式问题。今天有一个大的社区论坛在讨论这个问题,同时我们也在VVC的标准化中活跃着。

与此同时,我们还有一个法国项目正在进行中,我们正在与VideoLabs即VideoLAN公司合作。我们会有VVC的全面交付,我们计划在今年的IBC上做一个演示。

从HEVC到通用视频编码的下一代视频压缩技术_ide_05

在Ateme,我们主要实现的是绿色树时间线里的编码技术,从MPEG-2、H.264、H.265未来可能还有VVC。同时,有一个开源社区也是同步启动的,今天最知名的编解码器是VP9,而正在向开源编解码器靠拢的是来自AOM联盟,就是AV1。今天,他们正在讨论的是AV1的第二个版本,也就是AV2。

与VVC相同级别的还有另外两种编解码器EVC和LCEVC。LCEVC来自于日内瓦,而EVC则是由华为、高通、三星等一些公司的MPEG改编的。

从HEVC到通用视频编码的下一代视频压缩技术_ide_06

MPEG格式化的思路是,与前者相比,要达到2倍的减少。每当我们得到一个特定编解码器的成功尝试,每隔10年就会有一次。2016年谷歌的演讲是说我们可以每隔18个月就能推出新的编解码器,而AV1和AV2并不是这样。它们的进展很慢但就MPEG而言,我们在2013年就有了一个,现在我们在2020年得到下一个版本。

目前,我们从HEVC比VVC提高了37%。他们声称主观上比HEVC有50%的改进。我们在复杂度方面比HEVC有6-10倍的复杂度,所以这也是我们在ATEME中要做的工作,因为我们要做的是实时性编码。

从HEVC到通用视频编码的下一代视频压缩技术_ide_07

关于HEVC有一点,在HEVC标准化之后我们得到了很多专利池,这些专利池是在HEVC过程中出现的。之前只有一个单一的专利池主要是一些前标准公司拥有这个技术。后来到了MPEG LA出现了更多的HEVC专利池,这就给HEVC今天的部署增加了一些麻烦。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_08

然后,我们再来看看HEVC的反应也是对AV1的反应。在MPEG组织他们希望编解码器的定义是自己的,他们希望从MPEG那里得到而不是从其他协会或联盟那里得到。我们从MPEG那里得到的反应是创建了MPEG-5的第1部分叫EssentialVideo Coding(EVC);有两种版本文件一个是免版税的源自AVC的改进型,另一种是不免版税的但随着HEVC的改进它针对版税也更加友好。。

同时,我们有针对VVC的媒体编码行业论坛(MC-IF),目的是为了管理VVC内部的专利。大家可以看到VVC里面的专利会比HEVC多。同样这将是一个噩梦,但是VVC也有一个特殊性,你可以把里面有专利的工具去掉,可能会把你的技术中不想用的工具去掉。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_09

只是给大家介绍一些关于VVC的情况,他们在2015年就开始了一个探索阶段。2017年的时候有一个联合征集方案,他们做了一个实验软件基于HEVC的基础上,他们做了一个实验软件比HEVC提高了34%性能提升。

后来他们认为可以在3年的时间内停止规范化进程。他们声称可以比HEVC有50%的进步。他们从一开始就想把目标锁定在HDR 和360°VR;标准化也将在2020年7月完成项目发布。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_10

我们从这个幻灯片上看到了完整的过程。国际标准会在2020年7月发布,我们预计2021年或2022年有第一批硬件支持编解码。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_11

VVC内部没有革命,这是一个非常高级的图表,我们对每个编解码器都使用了它。它使用帧内预测、帧间预测以及介于这两者之间的反馈。我们今天所拥有的是,我们在它们的每一个中都得到了越来越复杂的错误。基本上和以前的编解码器一样没有什么变革。

从HEVC到通用视频编码的下一代视频压缩技术_ide_12

这里我们来看看HEVC和VVC的对比,左边是VVC,右边是HEVC。我们得到了更多的模式,更大的编码单元可达128x128。其中有不规则的形状,我们可以在下一张幻灯片上看到。另外,我们还有更多的DCT。

从HEVC到通用视频编码的下一代视频压缩技术_ide_13

这是一张将AVC与HEVC和VVC进行比较的图片。我们可以看到你在VVC中有更大的块,还有一些我们在HEVC和AVC上不能有的矩形形式来带来改进。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_14

从AVC开始我们只有9种模式。在HEVC中我们得到了35种模式的预测块,而在VVC中我们得到了67种模式!

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_15

今天在HEVC中,我们在以前的编解码器中没有的更多的东西是,我们有了一些六边形、三角形的形式,不再是矩形或四边形。这就是这个编解码器中真正新的部分。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_16

以上是VVC对比HEVC的性能结果。你可以看到编码部分的复杂度高达8倍,我们记录的复杂度,在MPEG的目标是解码器不爆炸。另外,大家还可以看到VVC比HEVC的图表对比。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_17

有趣的事情是我们在标准化过程开始时的复杂度。编码器的复杂度达到了2,现在我们的复杂度达到了9,但是我们的复杂度也从10%提高到了37%。我们看到解码器越来越停滞不前,我们正在为解码器本身找到更接近HEVC的东西。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_18

VVC和HEVC之间的一个很大的区别是我们对HEVC做了几个修改,其实是对HEVC进行了扩展。因此,您有一些扩展配置文件,Scalable HEVC(SHVC)和Screen Content Coding Extension(SCC)。

VVC的第一个版本从一开始就会有这一点,基本上,你不会一个接一个地得到。到2020年7月你应该在一个编解码器中提供所有这些功能,这将加快编解码器的可用性。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_19

现在我们还有另外3个编解码器要出来,其中一个已经完成了。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_20

可以理解为那就是AV1。你可以看到一些大公司参与到这个标准化活动中来。我们的想法是要有一些互操作性和开放性的东西,是专门针对网络边界的OTT传输进行优化。

至少比VP9有20%的压缩收益,这是他们可以比拟的。存储没有增加,它使用了一些基于经典结构的工具,也使用了一些新的工具。更有趣的是,他们在解码器中使用了胶片颗粒合成,而HEVC则没有,它又回来了,为VVC。而且是的,他们可以扩展性和SCC。

从HEVC到通用视频编码的下一代视频压缩技术_ide_21

HEVC和AV1比较,你有更大的编码块,这是他们比HEVC得到改进的地方。他们得到了更多的预测,他们有其他的方式来做时态预测。

从HEVC到通用视频编码的下一代视频压缩技术_ide_22

我们比较了HEVC和AV1,因为它们没有使用我们在MPEG中使用的通用测试条件,所以很容易在MPEG编解码器之间进行比较,但是在Alliance和MPEG编解码器之间进行比较就变得越来越困难。

我们尝试将一些工具限制在AV1中,一般来说AV1的码率比HEVC更低。同时你可以看到曲线是交叉的,所以最终很难得到改善。我们看到HEVC有10%的改进,但谷歌最近声称几乎与VVC处于同一水平。

我们目前的实现比HEVC慢2到3倍,所以它并不比HM慢50倍。它现在更快了,但仍然不比HEVC快。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_23

我要进入下一个MPEG-5第1部分,然后我将完成MPEG-5第2部分。

对于VVC,他们稍后开始活动,但MPEG的总体目标是与AV1和免版权费编解码器抗衡。这个想法是为了获得免版税的产品,并且对于Baseline配置文件来说确实非常快。我们可以为主要配置文件管理一些具有良好特许权使用费的产品,并且得到了三星,华为和高通公司的支持。

可以预期的时间表是,我们将在与VVC相同的日期之前获得国际标准的最终草案,基本上,一切都将在同一时间准备就绪。

从HEVC到通用视频编码的下一代视频压缩技术_ide_24

绿框是基准配置文件,可能它们重用了MPEG-2组件以能够执行基准配置文件。一些工具也是免版税的,它们主要是对熵编码进行的。他们使用了HEVC的QT结构使之免版税。蓝色框是主要配置文件之一,大多数工具都与VVC兼容。这是在某一个特定的时间点上对VVC的提炼。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_25

对于baseline profile,我们比H.264提升了40%。这点确实接近HEVC可以实现的目标。对于main profile我们的目标是比HEVC提高30%。您可以看到EVC baseline的编码器复杂度甚至比AVC还要快,而EVC则要慢4倍。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_26

最新的是V-Nova的Perseus专有编解码器。他们来到MPEG提出他们的解决方案,baseline是典型的MPEG标准。他们可以使用AVC、HEVC或MPEG-2。然后,他们在技术之上添加了自己的技术,以提高视频质量。它将同时尝试完成,它将获得V-Nova的更多许可,因为它们是它的唯一贡献者。

 

最新的是V-Nova公司的Perseus专有编解码器。他们来到MPEG提出了他们的解决方案,其baseline是典型的MPEG标准。他们可以使用AVC、HEVC或者MPEG-2。然后他们会在基础上加入他们的技术来提高视频质量。它将在同一时间初步完成,它将有更多的授权给V-Nova因为他们是唯一的贡献者。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_27

在底层,将运用到传统的编解码器。你可以添加一些其他层来改善这一点。LCEVC是上层,但基础层是标准编解码器。我们在此处看到的那样它们正在降低图像的分辨率,因此基础层确实很小,并且它们在基于子层编解码器的基础上增加了分辨率以及质量。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_28

这就是组件所要求的,因此我们具有这些不重叠的漂亮曲线。与H.264相比,我们的技术之间有了很大的进步。我们使用他们的参考软件进行了相同的分析,我们也在ATEME产品上做出了贡献,说LCEVC与传统编解码器之间存在误解。

目前,我们团队正在努力改善常见的测试条件,以确保我们可以复制并实现每一处。我们在这方面做出了贡献,只是为了澄清他们的目标,以便能够复制他们声称拥有的决议。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_29

在这里,我们几乎同时使用了3个编解码器。明年将发布。我们也许应该从所有这些硬件中获取一些硬件,至少我们知道三星将推动EVC。我们一定会努力推动VVC。

在2020年大家应该拥有第一个硬件,也是我们在2020年1月发布的第一个AV2代码库。我们期望在2026年(也许更早)发布一些AV2。

从HEVC到通用视频编码的下一代视频压缩技术_复杂度_30

只是一个简短的摘要,我不会花太多时间在此上。我们将在幻灯片的末尾显示所有编解码器之间的差异。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_31

作为演示文稿的摘要,我们有3个主要的编解码器同时相互对抗-VVC,EVC和AV1。我也没有提到对于AV1,我与Jean-Baptiste(VideoLAN)达成共识,我们在VideoLAN中获得了第一个软件实现,但与此同时,它们是今年将要推出的第一个硬件。

这样我们就能在IBC上演示哪种HD,HDR。大多数电视厂商将在2020年1月的CES上宣布他们将在其电视上支持AV1。我们还应该拥有到2020年支持AV1的电视。在2020年,我们将拥有两个编解码器,它们的硬件在2020年也可能会上市。

迄今为止,最好的仍然是VVC。EVC至少在专利问题上具有良好的权衡。我们为EVC基准提供了低端编解码器。这可能是AVC的成功,但AVC会在某个时候免费提供,是的,我们即将免费提供AV3。

有什么用吗?这就是问题所在。相反,我们的LCEVC似乎有不错的结果,但目前无法复制。我们希望对此特定编解码器进行澄清。在我们这方面,由于对VVC的需求更高,因此我们现在很可能会与VVC合作。

但是,如果需要,我们已经准备好过渡到EVC,并且我们已经有了AV1编解码器。

从HEVC到通用视频编码的下一代视频压缩技术_编解码器_32


标签:下一代,HEVC,编解码器,视频压缩,AV1,MPEG,VVC,我们
From: https://blog.51cto.com/u_13530535/6469017

相关文章

  • 下一代音视频SDK的方案设计
    经过五年的努力,腾讯云终端团队不断完善并积累出了一套完整的终端SDK方案体系,包含即时通信,主播推流,直播播放、点播播放、RTC实时互动、短视频录制,特效编辑等一系列音视频和实时通信相关的功能特性。在这些功能背后,团队是如何完成了框架设计、组件打磨、数据流转、性能优化的呢?本次Li......
  • 编解码再进化:Ali266与下一代视频技术
    过去的一年见证了人类百年不遇的大事记,也见证了多种视频应用的厚积薄发。而因此所带来的视频数据量的爆发式增长更加加剧了对高效编解码这样的底层硬核技术的急迫需求。正是在这样的大环境下,在ITU-TVCEG和ISO/IECMPEG两大标准组织再次联手推出的最新视频编解码标准VVC定稿不久之......
  • 开源共建下一代智能终端操作系统根社区 OpenHarmony携手伙伴聚力前行
    6月12日,2023开放原子全球开源峰会OpenHarmony分论坛(以下简称“分论坛”)在北京成功召开。OpenHarmony共建单位、生态伙伴齐聚一堂,共同展现了OpenHarmony在千行百业的落地成果、繁荣生态与最新技术进展。OpenHarmony项目群工作委员会委员、华为终端BG软件部副总裁柳晓见受邀出席......
  • CN2全称为中国电信下一代承载网
    CN2全称为中国电信下一代承载网,英文ChinatelecomNextCarrierNetwork,缩写为CNCN,进一步缩写为CN2。是对应老一代ChinaNet(电信叫163网)的新一代全球IP主干网(AS4809)。它是一个多业务的承载网络,它可以支持数据、语音、视频多种业务交融的应用...有租用过海外效劳器的朋友就会晓得,海......
  • Chtjpt:下一代技术的引领者
    Chtjpt(ChatbotwithGPT-3.5)是基于GPT-3.5架构开发的一种先进的对话生成技术。通过深度学习和自然语言处理技术的结合,Chtjpt在智能对话领域展现了卓越的性能。本文将探讨Chtjpt技术的背景、应用领域和未来发展前景。背景Chtjpt技术是基于GPT-3.5模型的扩展和改进,GPT-3.5是由OpenAI......
  • 下一代自然语言处理模型的巅峰之作
      ChatGPT是基于GPT-3.5架构的大型语言模型,通过自然语言处理技术,为用户提供高度智能、逼真的对话体验。本文将介绍ChatGPT的技术原理、应用场景以及未来发展趋势,探讨其在人工智能领域的重要性和潜力。1.引言  在人工智能领域,自然语言处理(NaturalLanguageProcessing,NL......
  • ChatJPT:下一代技术驱动的对话模型
       ChatJPT(Chat-basedGPT)是一种基于技术的对话模型,通过深度学习和自然语言处理技术,能够模拟人类对话,并提供有关各种主题的信息。本文将介绍ChatJPT的技术原理、应用领域以及对社会的潜在影响。引言随着人工智能和自然语言处理技术的不断发展,对话模型在各个领域中的应用日益......
  • 怎么让下一代准备好迎接更大挑战?
    经济形式不好,大家都知道,怎么办呢? 国家已经提出要走高质量发展道路,不断创新,但问题是,我是从填鸭式教育工厂出来的,我是没有创新能力的,或者说只有一点点的。 我能做到的,就是到网络上看看别人有没有好的想法,然后评估可行性。比如我想要一个真皮的手账本,很贵,大几百。突然发现小红......
  • Katana:一款功能强大的下一代网络爬虫框架
    关于KatanaKatana是一款功能强大的下一代网络爬虫框架,在该工具的帮助下,广大研究人员可以轻松完成资源爬取和渗透测试阶段的信息收集任务。功能介绍1、快速且完全可配置的网络资源爬取;2、支持标准模式和Headless模式;3、JavaScript解析/爬取;4、可自定义的自动化表单填充;5、范......
  • Neuron 2.4.0 发布:体验下一代工业物联网连接和管理
    近日,EMQ旗下的工业协议网关软件Neuron发布了最新的2.4.0版本。该版本新增了包括ABBCOMLI在内的四个南向驱动和一个北向应用,同时对现有的插件功能和UI进行了优化。快速体验Neuron新版本新增驱动插件满足不同场景需求IEC61850MMS和Allen-BradleyDF1IEC61850M......