推荐论文: https://arxiv.org/abs/2211.13745
论文摘要:本文研究了设备边缘协同推理系统中 CNN 推理的计算卸载。受新兴语义通信范式的启发,我们提出了一种新颖的基于自动编码器的 CNN 架构(AECNN),用于在终端设备上进行有效的特征提取。我们基于CNN中的通道注意方法设计了一个特征压缩模块,通过选择最重要的特征来压缩中间数据。为了进一步减少通信开销,我们可以使用熵编码来去除压缩数据中的统计冗余。在接收端,我们设计了一个轻量级解码器,通过学习接收到的压缩数据来重建中间数据,以提高准确性。为了加快收敛速度,我们使用分步方法来训练基于 ResNet-50 架构获得的神经网络。实验结果表明,AECNN 可以将中间数据压缩超过 256 倍,而精度损失仅为约 4%,优于最先进的工作 BottleNet++。与直接将推理任务卸载到边缘服务器相比,AECNN 可以更早地完成推理任务,特别是在无线信道条件较差的情况下,这凸显了 AECNN 在保证时间限制内更高准确性方面的有效性。
推荐论文+代码合集: https://paperswithcode.com/task/feature-compression
量化编码
目的:压缩特征,节省存储空间
- 向量(高维浮点)—-->码字的ID(一个整数)
- 通常放在索引项中
量化方法
- 向量量化VQ:k-means
- 迪卡尔积型(码字空间)
- >积量化(PQ)/OPQ/LOPQ
- 直和型:残差向量量化:RVQ
- 线性组合型:加性量化(AQ)、组合量化(CQ)
量化器目标:使均方误差(MSE)最小化
关于矢量量化(VQ):
矢量量化(VQ)是语音编码和图像编码节省带宽和存储的非常有效的方法。传统的矢量量化方法根据其码本生成过程主要可分为树形VQ、直和VQ、笛卡尔积VQ、格VQ、分类VQ、反馈VQ和模糊VQ七种类型。在过去的十年中,基于量化的近似最近邻(ANN)搜索发展非常迅速,并且出现了许多用于在大规模数据集的内存中搜索具有二进制代码的图像的方法。它们最令人印象深刻的特点是使用多个密码本。这就导致了两种码本的出现:线性组合码本和联合码本。这可能是未来的一个趋势。然而,这些方法只是在 ANN 搜索的速度、准确性和内存消耗之间寻找平衡,有时这三者之一会受到影响。因此,寻找一种能够在速度和精度之间取得平衡并且占用内存大小适中的矢量量化方法仍然是一个需要研究的问题。
迪卡尔积型(码字空间):积量化(Product Quantizer,PQ)
• 分段量化,每段一个VQ量化器
• 量化结果=各子量化结果的串连
• 码字空间=各子码书空间的直积
• 效果
以较小的空间开销得到了较大的码字空间
直和型:残差向量量化(RVQ)
- 多层级联量化
- 后层以前层的残差作为输入
- 量化结果=各层量化结果之和
- 码字空间=各层码书空间的直和
- 层数越多,量化误差越小
线性组合型:AQ
• 具有多个码书
• 量化结果=各码书量化结果之和
• 码字空间=各子码书空间的直和
相关网站:
(1) TRECVID:
, Digital Video Retrieval at NIST
(2) Video Olympics:
(3) Video Collection:
(4) Leonardo’ s Project:
(5) MPEG:
(6) Information Organization & Retrieval:
http://www2.sims.berkeley.edu/courses/is202/f01/index.html
(7) Movie Tools:
http://www.ricoh.co.jp/src/multimedia/MovieTool/index.html
(8) vdbms Project:
http://www.cs.purdue.edu/vdbms/
(9) DirectShow:
http://www.codeproject.com/KB/directx/directshownet.aspx
标签:指南,编码,www,http,入门,VQ,码字,org,量化 From: https://www.cnblogs.com/sddai/p/17948044