首页 > 其他分享 >语义通信论文阅读(1):Beyond Transmitting Bits: Context, Semantics, and Task-Oriented Communications

语义通信论文阅读(1):Beyond Transmitting Bits: Context, Semantics, and Task-Oriented Communications

时间:2023-04-09 16:55:30浏览次数:35  
标签:Task Context img Transmitting 语义 csdnimg https png cn

@

目录

![在这里插入图片描述](/i/ll/?i=dd937c25348649b8ac03b210baad237c.png#pic_center =360x70)
《超越比特传输:上下文、语义和面向任务的通信》

这是2022年10月发布在IJSAC上的一篇语义通信的综述,作者是帝国理工学院的Deniz Gündüz,他也是Deep-JSCC等一系列文章的作者。这篇文章就是从香农的信息论出发,总结了语义通信迄今为止的工作,涵盖了理论基础、算法以及基础的实现。

引言

目前通信系统的目标是在噪声传输信道上可靠的传输比特,而香农的信道编码理论为这种传输提供了根本的限制,系统仍然不知道所要传达的信息的准确含义或者传达这些目的的意义。但正是这种与含义的分离,使得香农的方法能够从工程中抽离出来,即在某一点生成的数字序列,在另一点能够逐步的准确的复制出来
然而,现在的通信目标发生了转变,由准确重建信息变成了使终端能够在正确的时间以及环境下做出正确的推断以及决策。变成这种趋势有以下两种原因:

  1. 新兴应用带来大量数据,大模型将会带来大流量。例如自动驾驶,每辆无人驾驶汽车每天都会从其众多传感器(包括雷达、LIDAR、摄像头和超声波传感器)中收集数十万亿比特级的数据。
  2. 新兴应用要求极低的端到端延迟,例如当视频信号被自动驾驶汽车用于检测和避免街道上潜在的障碍物或行人时,即使是微小的延迟也可能是不可接受的。

所以将智能纳入通信系统设计,以最快和最可靠的方式提取和传递与任务相关的信息是非常有必要的。


但是什么是语义?这是一个有争议的话题。
1938年,Morris将语言分为三类:
![1 )句法:研究符号及其与其他符号的关系;
2 )语义学:研究符号及其与世界的关系;
3 )语用学:研究符号及其与使用者的关系。](/i/ll/?i=82184cbf3c57486da54e1e34fcf299f4.png#pic_center =360x170)
语义学建立在句法的基础上,其主要目标是理解符号与其所指称的对象之间的关系。
Weaver由此提出了通信问题的三个层次:
![在这里插入图片描述](/i/ll/?i=d0e2baaf051140d69d82b9c32b5449eb.png#pic_center =460x140)
Shannon的理论虽然表面上只适用 于A级问题,但实际上对B级和C级问题是有帮助和启发的。所以后来很多的语义通信的问题依然是基于香农的信息论来进行研究的。

语义信息度量

语义熵是语义平均水平的度量,熵在物理学中被用来衡量一个系统的混乱程度,在语义学中是衡量一个句子的不确定程度。
![在这里插入图片描述](/i/ll/?i=4bd7189d79ab493895567b8facea02c7.png#pic_center =240x100)


1952年, Carnap and Bar-Hillel首先阐述了在给定的语言系统中句子的语义熵的概念,并提供了一种测量方法:$$ H(s,e)=-logc(s,e) $$ 其中c(s, e)是句子s在证据e上的确认程度,表示为$$c(s,e) = \frac{m(e,s)}{m(e)}$$\(m(e,s)\)是s在e上的逻辑概率。这代表了在证据e上,m(e,s)越大,也就是e对消除s不确定性的帮助越大,那么\(logc(s,e)\)越大,加上负号后整个系统的熵越小,也就是混乱程度越小。但Carnap and Bar-Hillel由此提出了语义悖论——这会将最高的信息分配给了矛盾的句子。


2019年Venhuizen等人根据语言的世界结构(即潜在的背景知识)而不是语言的概率结构的语言理解模型阐述了语义熵
![在这里插入图片描述](/i/ll/?i=80b5ab5b925a476095709c197024e0e0.png#pic_center =330x80)
形变的那个\(\Mu\)是模型的集合,反映了世界的概率结构,\(P ( V_M | V_t )\)是给定\(V_t\)下\(V_M\)的条件概率。这种以理解为中心的语义熵概念依赖于语言经验和世界知识,量化了关于整个意义空间的不确定性。
我的理解是语义熵代表\(V_t\)能消除整个系统多少不确定性。


除了上述语言系统外,面向智能任务的语义熵也得到了研究。1997年Melamed提出了一种利用平行文本语料库中词的翻译分布来度量翻译任务中语义熵的信息论方法,每个单词w的语义熵为
![在这里插入图片描述](/i/ll/?i=5464f7ffa2f34317ab5c8764136159fe.png#pic_center =400x110)


2020年Liu通过引入公理化模糊集理论中的隶属度定义了语义熵
![在这里插入图片描述](/i/ll/?i=eba4126fa0264587900f02bbb063ee89.png#pic_center =700x120)
有时,一个物体是否具有某种信息无法用概率来衡量,比如一个人是否属于高个,不能说他有多少概率是高个,而是它属于高个这个集合的隶属度是多少,190比140的人隶属度会更高。定义\(Dj(\zeta) = x\)为属于某个类别\(C_j\)的隶属度与属于所有类别的隶属度的比值,更加确定属于某个类别\(D_j\)就会趋向于1导致系统熵越小。这样定义可以得到每个类的最优语义描述,并最小化分类器设计中的不确定性。


2020年,Chattopadhyay提出一个信息论框架来量化任何任务和任何类型信源的语义信息。
语义熵被定义为关于数据S的语义查询的最小数目,其答案足以预测任务V
![在这里插入图片描述](/i/ll/?i=56e5a39b05194444ab994a2d0a8d20bb.png#pic_center =400x100)
也就是说,我向一个系统提问,能解决任务的问问题的最小数目就是我的语义熵。
可以看到,语义熵的定义有个特点:差异

知识图谱

知识可以被定义为将有助于理解和得出结论的可用信息连接起来的能力,而知识图谱的概念是为了使这种理解成为可能而出现的信息网络
![在这里插入图片描述](/i/ll/?i=f1b8e8458bde4e8eb3c36f0b1f24a7d4.png#pic_center =400x330)
知识图谱有三个组成部分:节点、边、标签。
![在这里插入图片描述](/i/ll/?i=104d214e6f054d4b9c383cfd3fba391a.png#pic_center =750x330)

机器学习在语义通信的应用

![在这里插入图片描述](/i/ll/?i=194f2c04f995491791dd52520288c26c.png#pic_center =430x140)

语义压缩的最终目的是在发送端提取源数据中与接收端要执行的任务最相关的语义信息。通过过滤掉与任务无关的数据,可以显著降低带宽消耗和传输延迟。然而,上述信息论框架要么假设数据已知统计量和任务的相关特征,要么局限于参数估计框架,假设样本来自于同一种分布。另一方面,在大多数实际应用中我们无法获得统计信息,往往需要基于单个数据样本进行推断。
所以目前有种方法是考虑一个数据驱动的框架,在这个框架中我们可以获取一个大的数据集,然后使用机器学习工具来训练一个模型,以方便语义信息提取,而不需要数学模型。文章从训练和推理两个阶段来阐述:

远程模型训练

在训练阶段,单个节点或多个节点(每个节点都有自己的数据集)与目标节点通信,目标是在目标处重建特定推理任务的模型。
![在这里插入图片描述](/i/ll/?i=23366d2c24b743c3bcb866c10abd97e8.png#pic_center =630x96)
这个问题是一个特殊的远程率失真问题的实例,如上图将Encoder处的数据集作为编码器处可用的信息,而模型本身作为解码器想要恢复的远程源。但这里的失真度量不是接收端与发送端神经网络模型权重的相似性,而是Decoder处在给定的度量下的性能,例如分类准确率。
补充:度量还有PSNR 峰值信噪比、SSIM 结构相似性、MS-SSIM 多尺度结构相似性、NIQE自然图像质量等等。

解决办法
1、在编码器处估计远程源<训练模型>
2、在速率受限信道上以最高质量将模型传送给解码器<压缩模型>

补充:压缩模型包括参数剪枝、量化、低秩分解 和知识蒸馏等等。
在远程模型训练中,一种更常见的场景是分布式训练,多个节点各自拥有自己的本地数据集,通过与远程参数服务器进行通信或相互通信来训练模型。
![在这里插入图片描述](/i/ll/?i=3012c07dac75442e9fd38482dc927590.png#pic_center =330x260)
这种联邦训练可以被视为一个多终端率失真问题。

剩下的慢慢更TAT

标签:Task,Context,img,Transmitting,语义,csdnimg,https,png,cn
From: https://www.cnblogs.com/htx2000/p/17300566.html

相关文章

  • COMP20007 Task 2: C Problem
    Task2:CProblemAssignment1GeneralTask1:AlgorithmicDesignTask2:CProblemAssignmentSubmissionAcademicHonestyLatePolicyRequirements:CProgrammingProgrammingStyleMarkBreakdownAdditionalSupportAcknowledgementsTask2:CProblemOlivia'sgrandfa......
  • Httpcontext.signIn() 执行了什么?
    asp.netcore登录的时候可以写 Httpcontext.signIn(user);这个方法,如果用cookie最后会些写cookie信息到Httpcontext.respones中。定义publicstaticTaskSignInAsync(thisHttpContextcontext,string?scheme,ClaimsPrincipalprincipal,AuthenticationProperties?p......
  • Go-context源码解析
    首先我们简单的来看一个例子,如下:(学好这个例子,我们就可以说完全掌握住context了,并且能重构一个contextfuncmain(){ ctx,cancel:=context.WithCancel(context.Background()) ctxV:=context.WithValue(ctx,1,"HelloWorld") gofunc(ctxcontext.Context){ val:=......
  • HDU - 3572 Task Schedule (最大流)
    题目大意:有N个任务,M台机器。每个任务有相应的起始时间,截至时间和完成时间每台机器一小时可以做1个单位的工作量,每个任务的完成可以不连续,但每次只能由一台机器完成问能否完成所有任务解题思路:因为只有500分钟,所以可以将每分钟都设成1条边,连向超级汇点,容量为M每个任务连接向......
  • 使用DbContext.Set<TEntity>()方法也可以对数据库实体进行CRUD操作
    我们可以用DbContext.Set<TEntity>()方法获取到一个DbSet<TEntity>对象,从而对泛型TEntity类所代表的数据库表进行CRUD操作。例如我们现在有数据库表和TEntity类Person,那么下面两种写法是完全等价的:dbContext.Persons.Take(10).ToList();//dbContext.Persons等于dbContext.Set<P......
  • 多线程任务怎么选 Thread,ThreadPoll,Task
    提问多线程任务怎么选Thread,ThreadPoll,Task回答Task原因Thread:创建销毁代价昂贵ThreadPoll:管理线程资源Task基于线程池......
  • 线程池之FutureTask、ThreadPoolExecutor源码分析
    前言在我们日常工作中,我们经常会用到多线程的来处理一些异步任务,提高系统吞吐量,但是线程毕竟是一种昂贵的系统的资源,我们不应该频繁的去申请销毁。在java的projectloom还未正式release的时候,我们常用池化的方式来使用线程。所以了解线程池的设计思想能够有助于我们更好的使用它,......
  • c++ std::package_task,task.get_future()
    #include<iostream>#include<future>#include<thread>intcountdown(intfrom,intto){for(inti=from;i!=to;--i){std::cout<<i<<std::endl;std::this_thread::sleep_for(std::chrono::seconds(1));......
  • 加载spring配置的两个方法AnnotationConfigApplicationContext()和getRootConfigClass
    在Spring中,AnnotationConfigApplicationContext类和AbstractAnnotationConfigDispatcherServletInitializer类中的getRootConfigClasses()方法都是用来加载Spring配置类,并创建Spring容器的。因此,它们的作用是相似的,都是用来配置Spring容器的。但是,它们的使用场景和......
  • ConTeXt 蹊径
    在TeX世界里,ConTeXt可与LaTeX比肩,但国内用户甚少。大概是2009年,初学ConTeXt时,曾经写了一份笔记,内容颇为粗陋,当时CTeX论坛的朋友协助打包上传到了CTAN。2011年我对该笔记作了一些修改,并在文中许诺在当年年底作一番大修,然而我食言了。很多年后,我果然胖了起来。之后,......