特征量化编码入门指南

时间：2024-01-05 20:46:48浏览次数：34

论文摘要：本文研究了设备边缘协同推理系统中 CNN 推理的计算卸载。受新兴语义通信范式的启发，我们提出了一种新颖的基于自动编码器的 CNN 架构（AECNN），用于在终端设备上进行有效的特征提取。我们基于CNN中的通道注意方法设计了一个特征压缩模块，通过选择最重要的特征来压缩中间数据。为了进一步减少通信开销，我们可以使用熵编码来去除压缩数据中的统计冗余。在接收端，我们设计了一个轻量级解码器，通过学习接收到的压缩数据来重建中间数据，以提高准确性。为了加快收敛速度，我们使用分步方法来训练基于 ResNet-50 架构获得的神经网络。实验结果表明，AECNN 可以将中间数据压缩超过 256 倍，而精度损失仅为约 4%，优于最先进的工作 BottleNet++。与直接将推理任务卸载到边缘服务器相比，AECNN 可以更早地完成推理任务，特别是在无线信道条件较差的情况下，这凸显了 AECNN 在保证时间限制内更高准确性方面的有效性。

推荐论文+代码合集： https://paperswithcode.com/task/feature-compression

量化编码

目的：压缩特征，节省存储空间

向量（高维浮点）—-->码字的ID（一个整数）
通常放在索引项中

量化方法

向量量化VQ:k-means
迪卡尔积型（码字空间）
- >积量化（PQ）/OPQ/LOPQ
直和型：残差向量量化：RVQ
线性组合型：加性量化（AQ）、组合量化（CQ）

量化器目标：使均方误差（MSE）最小化

关于矢量量化（VQ）：

矢量量化（VQ）是语音编码和图像编码节省带宽和存储的非常有效的方法。传统的矢量量化方法根据其码本生成过程主要可分为树形VQ、直和VQ、笛卡尔积VQ、格VQ、分类VQ、反馈VQ和模糊VQ七种类型。在过去的十年中，基于量化的近似最近邻（ANN）搜索发展非常迅速，并且出现了许多用于在大规模数据集的内存中搜索具有二进制代码的图像的方法。它们最令人印象深刻的特点是使用多个密码本。这就导致了两种码本的出现：线性组合码本和联合码本。这可能是未来的一个趋势。然而，这些方法只是在 ANN 搜索的速度、准确性和内存消耗之间寻找平衡，有时这三者之一会受到影响。因此，寻找一种能够在速度和精度之间取得平衡并且占用内存大小适中的矢量量化方法仍然是一个需要研究的问题。

迪卡尔积型（码字空间）：积量化（Product Quantizer,PQ）

• 分段量化，每段一个VQ量化器

• 量化结果=各子量化结果的串连

• 码字空间=各子码书空间的直积

• 效果

以较小的空间开销得到了较大的码字空间

直和型：残差向量量化（RVQ）

多层级联量化
后层以前层的残差作为输入
量化结果=各层量化结果之和
码字空间=各层码书空间的直和
层数越多，量化误差越小

线性组合型：AQ

• 具有多个码书

• 量化结果=各码书量化结果之和

• 码字空间=各子码书空间的直和

相关网站：

(1) TRECVID:

http://trecvid.nist.gov

, Digital Video Retrieval at NIST

(2) Video Olympics:

http://www.videolympics.org/

(3) Video Collection：

http://www.open-video.org

(4) Leonardo’ s Project:

http://www.chiariglione.org

(5) MPEG:

http://www.mpeg.org

(6) Information Organization & Retrieval:

http://www2.sims.berkeley.edu/courses/is202/f01/index.html

(7) Movie Tools:

http://www.ricoh.co.jp/src/multimedia/MovieTool/index.html

(8) vdbms Project:

http://www.cs.purdue.edu/vdbms/

(9) DirectShow:

http://www.codeproject.com/KB/directx/directshownet.aspx

标签：指南,编码,www,http,入门,VQ,码字,org,量化
From： https://www.cnblogs.com/sddai/p/17948044

编码列表
三列依次是编码名称CodePage描述IBM03737IBMEBCDIC(美国-加拿大)IBM437437OEM美国IBM500500IBMEBCDIC(国际)ASMO-708708阿拉伯字符(ASMO-708)DOS-720720阿拉伯字符(DOS)ibm737737希腊字符(DOS)ibm7757......
【Python入门教程】读取图片信息最全教程（经纬度、偏转角、无人机影像、大疆）
通常读取图片的属性信息（如经纬度、拍摄时间、IMU数据等）都是通过exifread库进行读取，但是有些图片用这个库读取的效果不好。所以今天我就和大家分享一下如何使用Python读取图片属性信息的三种方法。1GDAL读取 GDAL库是用来处理卫星影像的库，它同样可......
成为 Vim 大师的必备教程：从入门到精通
导语：Vim作为一款强大而高效的文本编辑器，一直备受程序员和技术爱好者的喜爱。本篇教程将带你逐步掌握Vim的各种技巧和功能，助你成为一名真正的Vim大师。一、Vim的起源和特点，以及为什么选择使用Vim作为文本编辑器Vim是一款经典的文本编辑器，诞生于20世纪80年代，是Vi编辑器的改......
现代 CMake 模块化项目管理指南
现代CMake模块化项目管理指南参考小彭老师的视频教程整理笔记，学习同时方便快速查阅，视频链接如下【公开课】现代CMake模块化项目管理指南【C/C++】对应课程PPT和源码见https://github.com/parallel101/course文件/目录组织规范完整案例参考源码仓库https://github.com......
深度学习入门 & 王木头学科学
感知机perceptron线性函数+阶跃函数;分界线+判断处于分界线的哪一边.感知机的提出:解决非解析问题的简单模板.感知机的缺陷:异或问题.通过增加层,提高维度.多层感知机与神经网络的区别:激活函数是否连续.连续光滑的函数是学习的一个关键要素.损失函数......
[转帖]Linux中的lstopo命令（详细指南）
https://juejin.cn/post/7117544110856077343 目录：简介语法命令总结参考文献介绍lstopo命令是用来显示系统的拓扑结构的。它提供了关于NUMA内存节点、共享缓存、CPU包、处理器内核和线程等信息。语法它渲染由hwloc发现的机器拓扑结构，有两种主要模式：文本渲染或图......
Jest之单元测试入门
一，测试平台1，使用nodejs工程二，准备工作1，npminstalljestsave-dev2，package.json的配置三，开始编写测试代码1，sum.js：业务逻辑代码（被测试）module.exports.sum=function(a,b){returna+b;}2,sun.test.js：测试代码，用于测试sum.js2.1,注意：一定要使用test.jsconstsum......
Maven基础入门及与IDEA的集成（下）常用命令、生命周期及与IDEA集成
Maven基础入门Maven常用命令compile:编译在项目的根目录打开cmd窗口，运行mvncompile命令，Maven即开始进行自动编译项目。Maven会自动开始下载依赖项，然后进行源码的编译，并将生成的编译文件存入target文件中。clean:清理mvnclean命令会清除compile时生成的target文件夹。test:测试自......
想快人一步！不得不看的《鸿蒙（HarmonyOS）学习指南》
鸿蒙就是鸿蒙，安卓就是安卓据鸿蒙产业链人士透露，华为下一代鸿蒙5.0版本或将不再兼容安卓系统，此举意味着鸿蒙系统将退出Android生态圈，华为手机也将只支持鸿蒙系统应用。今后国内手机操作系统，将形成由安卓与iOS两大阵营演变成Android、iOS、Harmony三分天下的局面。随着鸿蒙发展速度越......
支付系统日志设计完全指南：构建高效监控和问题排查体系的关键基石
这是《百图解码支付系统设计与实现》专栏系列文章中的第（7）篇。在一家头部互联网公司发现一些工作多年的同学打印的日志也是乱七八糟的，所以聊聊这个话题。本文主要讲结构清晰的日志在支付系统中的重要作用，设计日志规范需要遵守的一些基本原则，以及接口摘要日志、业务摘要日志、详细日......

特征量化编码入门指南

量化编码

关于矢量量化（VQ）：

相关网站：

相关文章

赞助商

阅读排行