首页 > 其他分享 >信道容量的概念&推论

信道容量的概念&推论

时间:2024-11-08 23:44:33浏览次数:3  
标签:推论 yj log mid 信道容量 概念 right xi left

目录

信道容量的定义

信道容量是指在取遍 X X X 的不同分布 p ( x i ) p(x_i) p(xi​)时,互信息 I ( X ; Y ) I(X;Y) I(X;Y)的最大值,即

C = max ⁡ p ( x i ) I ( X ; Y ) \mathcal{C}=\operatorname*{max}_{p(x_{i})}I\left(X;Y\right) C=p(xi​)max​I(X;Y)

一般地说,确定一个信道的容量 c c c是一个非常困难的问题,但对于一些特殊信道,简便求解信道容量是可能的。后面会计算对称信道的信道容量作为示例。



定义的合理性

信道容量是信息论中的关键性概念, 是信道编码定理中高效传输和可靠传输的理论平衡点。而信道容量的定义的合理性基于互信息是输入概率分布的连续函数和互信息是输入概率分布的上凸函数

互信息是输入概率分布的上凸函数:
证明:
I ( X ; Y ) = H ( X ) − H ( X ∣ Y ) = ∑ i j p ( x i , y j ) log ⁡ p ( x i , y j ) p ( x i ) p ( y j ) = ∑ i j p ( x i ) p ( y j ∣ x i ) log ⁡ p ( x i ) p ( y j ∣ x i ) p ( x i ) p ( y j ) = ∑ i j p ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) p ( y j ) \begin{aligned}&I\left(X;Y\right)=H\left(X\right)-H\left(X\mid Y\right)\\&=\sum_{ij}p\left(x_{i},y_{j}\right)\log\frac{p\left(x_{i},y_{j}\right)}{p\left(x_{i}\right)p\left(y_{j}\right)}\\&=\sum_{ij}p\left(x_{i}\right)p\left(y_{j}\mid x_{i}\right)\log\frac{p\left(x_{i}\right)p\left(y_{j}\mid x_{i}\right)}{p\left(x_{i}\right)p\left(y_{j}\right)}\\&=\sum_{ij}p\left(x_{i}\right)p\left(y_{j}\mid x_{i}\right)\log\frac{p\left(y_{j}\mid x_{i}\right)}{p\left(y_{j}\right)}\end{aligned} ​I(X;Y)=H(X)−H(X∣Y)=ij∑​p(xi​,yj​)logp(xi​)p(yj​)p(xi​,yj​)​=ij∑​p(xi​)p(yj​∣xi​)logp(xi​)p(yj​)p(xi​)p(yj​∣xi​)​=ij∑​p(xi​)p(yj​∣xi​)logp(yj​)p(yj​∣xi​)​​
设对应输入分布 p 1 ( x ) p_1(x) p1​(x)的互信息是 I 1 ( X ; Y ) , Y I_1( X; Y) , Y I1​(X;Y),Y 的 分 布 是 p 1 ( y ) ; p_1( y) ; p1​(y);对应输入分布 p 2 ( x ) p_2(x) p2​(x)的互信息是 I 2 ( X ; Y ) , Y I_2(X;Y),Y I2​(X;Y),Y 的分布是 p 2 ( y ) ; p_2(y); p2​(y);
对任意的 0 ⩽ λ ⩽ 1 \leqslant\lambda\leqslant1 ⩽λ⩽1,设对应分布 q ( x ) : = λ p 1 ( x ) + ( 1 − λ ) p 2 ( x ) q(x):=\lambda p_{1}(x)+(1-\lambda)p_{2}(x) q(x):=λp1​(x)+(1−λ)p2​(x)的互信息是 I ( X , Y ) , Y I(X,Y),Y I(X,Y),Y 的分布是 q ( y ) q(y) q(y)。于是,
λ I 1 ( X ; Y ) + ( 1 − λ ) I 2 ( X ; Y ) − I ( X ; Y ) = λ ∑ i j p 1 ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) p 1 ( y j ) + ( 1 − λ ) ∑ i j p 2 ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) p 2 ( y j ) − ∑ i j q ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) q ( y j ) = λ ∑ i i p 1 ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x ˙ i ) p 1 ( y j ) + ( 1 − λ ) ∑ i j p 2 ( x i ) p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) p 2 ( y j ) − ∑ i j [ λ p 1 ( x i ) + ( 1 − λ ) p 2 ( x i ) ] p ( y j ∣ x i ) log ⁡ p ( y j ∣ x i ) q ( y j ) = λ ∑ i j p 1 ( x i ) p ( y j ∣ x i ) log ⁡ q ( y j ) p 1 ( y j ) + ( 1 − λ ) ∑ i j p 2 ( x i ) p ( y j ∣ x i ) log ⁡ q ( y j ) p 2 ( y j ) ⩽ λ log ⁡ [ ∑ i j p 1 ( x i ) p ( y j ∣ x i )   q ( y j ) p 1 ( y j ) ] + ( 1 − λ ) log ⁡ [ ∑ i j p 2 ( x i ) p ( y j ∣ x i )   q ( y j ) p 2 ( y j ) ] = λ log ⁡ [ ∑ j p 1 ( y j )   q ( y j ) p 1 ( y j ) ] + ( 1 − λ ) log ⁡ [ ∑ i p 2 ( y j )   q ( y j ) p 2 ( y j ) ] = λ log ⁡ [ ∑ i q ( y j ) ] + ( 1 − λ ) log ⁡ [ ∑ j q ( y j ) ] = λ log ⁡ 1 + ( 1 − λ ) log ⁡ 1 = 0 \begin{aligned} &\lambda I_1\left(X;Y\right)+\left(1-\lambda\right)I_2\left(X;Y\right)-I\left(X;Y\right)\\ &=\lambda\sum_{ij}p_1(x_i)p(y_j\mid x_i)\log\frac{p(y_j\mid x_i)}{p_1(y_j)}+(1-\lambda)\sum_{ij}p_2(x_i)p(y_j\mid x_i)\log\frac{p(y_j\mid x_i)}{p_2(y_j)}-\sum_{ij}q\left(x_i\right)p\left(y_j\mid x_i\right)\log\frac{p\left(y_j\mid x_i\right)}{q\left(y_j\right)}\\ &=\lambda\sum_{ii}p_{1}(x_{i})p(y_{j}\mid x_{i})\log\frac{p(y_{j}\mid\dot{x}_{i})}{p_{1}(y_{j})}+(1-\lambda)\sum_{ij}p_{2}(x_{i})p(y_{j}\mid x_{i})\log\frac{p(y_{j}\mid x_{i})}{p_{2}(y_{j})}-\sum_{ij}[\lambda p_{1}(x_{i})+(1-\lambda)p_{2}(x_{i})]p(y_{j}\mid x_{i})\log\frac{p(y_{j}\mid x_{i})}{q(y_{j})}\\ &=\lambda\sum_{ij}p_{1}\left(x_{i}\right)p\left(y_{j}\mid x_{i}\right)\log\frac{q\left(y_{j}\right)}{p_{1}\left(y_{j}\right)}+(1-\lambda)\sum_{ij}p_{2}(x_{i})p(y_{j}\mid x_{i})\log\frac{q(y_{j})}{p_{2}(y_{j})}\\ &\leqslant\lambda\log\left[\sum_{ij}p_1(x_i)p(y_j\mid x_i)\:\frac{q(y_j)}{p_1(y_j)}\right]+(1-\lambda)\log\left[\sum_{ij}p_2(x_i)p(y_j\mid x_i)\:\frac{q(y_j)}{p_2(y_j)}\right]\\ &=\lambda\log\left[\sum_jp_1(y_j)\:\frac{q(y_j)}{p_1(y_j)}\right]+( 1- \lambda) \log \left [ \sum _{i}p_{2}( y_{j}) \:\frac {q( y_{j}) }{p_{2}( y_{j}) }\right]\\ &=\lambda\log\left[\sum_{i}q\left(y_{j}\right)\right]+\left(1-\lambda\right)\log\left[\sum_{j}q\left(y_{j}\right)\right]\\ &=\lambda\log1+(1-\lambda)\log1\\ &=0 \end{aligned} ​λI1​(X;Y)+(1−λ)I2​(X;Y)−I(X;Y)=λij∑​p1​(xi​)p(yj​∣xi​)logp1​(yj​)p(yj​∣xi​)​+(1−λ)ij∑​p2​(xi​)p(yj​∣xi​)logp2​(yj​)p(yj​∣xi​)​−ij∑​q(xi​)p(yj​∣xi​)logq(yj​)p(yj​∣xi​)​=λii∑​p1​(xi​)p(yj​∣xi​)logp1​(yj​)p(yj​∣x˙i​)​+(1−λ)ij∑​p2​(xi​)p(yj​∣xi​)logp2​(yj​)p(yj​∣xi​)​−ij∑​[λp1​(xi​)+(1−λ)p2​(xi​)]p(yj​∣xi​)logq(yj​)p(yj​∣xi​)​=λij∑​p1​(xi​)p(yj​∣xi​)logp1​(yj​)q(yj​)​+(1−λ)ij∑​p2​(xi​)p(yj​∣xi​)logp2​(yj​)q(yj​)​⩽λlog[ij∑​p1​(xi​)p(yj​∣xi​)p1​(yj​)q(yj​)​]+(1−λ)log[ij∑​p2​(xi​)p(yj​∣xi​)p2​(yj​)q(yj​)​]=λlog[j∑​p1​(yj​)p1​(yj​)q(yj​)​]+(1−λ)log[i∑​p2​(yj​)p2​(yj​)q(yj​)​]=λlog[i∑​q(yj​)]+(1−λ)log[j∑​q(yj​)]=λlog1+(1−λ)log1=0​
不等式源于对数函数的上凸性质



特殊信道容量的计算

信道容量的定义部分提到过,一般确定一个信道的容量 c c c是一个非常困难的问题,但对于一些特殊信道,简便求解信道容量是可能的。

对称信道的信道容量

对称信道的信道容量为:
C = log ⁡ t − ∑ j = 1 t p ( y j ∣ x i ) log ⁡ 1 p ( y j ∣ x i ) \mathcal{C}=\log\mathrm{t-\sum_{j=1}^tp(y_j|x_i)\log\frac1{p(y_j|x_i)}} C=logt−j=1∑t​p(yj​∣xi​)logp(yj​∣xi​)1​
对于任意的 i = 1 , ⋯   , s i=1,\cdots,s i=1,⋯,s 成立。而且信道容量可在等概率输入,即 p ( x i ) = 1 s p( x_i) = \frac 1s p(xi​)=s1​时达到。

证明 由定义知:
H ( Y ∣ X ) = ∑ i p ( x i ) [ ∑ j p ( y j ∣ x i ) log ⁡ 1 p ( y j ∣ x i ) ] H\left(Y\mid X\right)=\sum_ip\left(x_i\right)\left[\sum_jp\left(y_j\mid x_i\right)\log\frac{1}{p\left(y_j\mid x_i\right)}\right] H(Y∣X)=i∑​p(xi​)[j∑​p(yj​∣xi​)logp(yj​∣xi​)1​]
利用信道的对称性,上式可改写成
H ( Y ∣ X ) = [ ∑ j p ( y j ∣ x i ) log ⁡ 1 p ( y j ∣ x i ) ] [ ∑ i p ( x i ) ] = ∑ j p ( y j ∣ x i ) log ⁡ 1 p ( y j ∣ x i ) H\left(Y\mid X\right)=\left[\sum_{j}p\left(y_{j}\mid x_{i}\right)\log\frac{1}{p\left(y_{j}\mid x_{i}\right)}\right]\left[\sum_{i}p\left(x_{i}\right)\right]\\=\sum_{j}p\left(y_{j}\mid x_{i}\right)\log\frac{1}{p\left(y_{j}\mid x_{i}\right)} H(Y∣X)=[j∑​p(yj​∣xi​)logp(yj​∣xi​)1​][i∑​p(xi​)]=j∑​p(yj​∣xi​)logp(yj​∣xi​)1​
上式表明 H ( Y ∣ X H(Y|X H(Y∣X )不依赖于输入 X X X的分布,由此得到:
C = max ⁡ p ( x i ) I ( Y , X ) = max ⁡ p ( x i ) [ H ( Y ) − H ( Y ∣ X ) ] = [ max ⁡ p ( x i ) H ( Y ) ] − H ( Y ∣ X ) \begin{aligned}\text{C}&=\max_{p(x_{i})}I\left(Y,X\right)\\&=\max_{p(x_{i})}[H(Y)-H(Y\mid X)]\\&=\left[\max_{p(x_{i})}H\left(Y\right)\right]-H\left(Y\mid X\right)\end{aligned} C​=p(xi​)max​I(Y,X)=p(xi​)max​[H(Y)−H(Y∣X)]=[p(xi​)max​H(Y)]−H(Y∣X)​
由于 H ( Y ) H(Y) H(Y)在 Y Y Y为等概率分布时达到最大值 log ⁡ t \log t logt,而当 X X X 的分布为等概率分布 p ( x i ) = 1 / s p(x_{i})=1/s p(xi​)=1/s 时,因为信道为对称信道,所以推得 Y − Y- Y−定也是等概率分布。这样只需把 X X X取成等概率分布,即可得到信道容量 c c c:
C = log ⁡ t − ∑ j = 1 t p ( y j ∣ x i ) log ⁡ 1 p ( y j ∣ x i ) C=\log t-\sum_{j=1}^tp(y_j\mid x_i)\log\frac{1}{p(y_j\mid x_i)} C=logt−j=1∑t​p(yj​∣xi​)logp(yj​∣xi​)1​

交叉概率为p的二元对称信道的信道容量

令t=2,可得交叉概率为 p p p的二元对称信道的信道容量为
c = 1 − p log ⁡ 1 p − ( 1 − p ) log ⁡ 1 1 − p = 1 − H ( p ) c=1-p\log\frac{1}{p}-(1-p)\log\frac{1}{1-p}=1-H(p) c=1−plogp1​−(1−p)log1−p1​=1−H(p)
其中 H ( p ) H(p) H(p)为熵函数。



标签:推论,yj,log,mid,信道容量,概念,right,xi,left
From: https://blog.csdn.net/weixin_73404807/article/details/143487667

相关文章

  • 原木、实木和家具是常见的木材相关术语,它们之间有一定的区别,但容易让人混淆。下面我将
    原木、实木和家具是常见的木材相关术语,它们之间有一定的区别,但容易让人混淆。下面我将为你详细解释如何区分这三者以及它们的不同之处,帮助你更好地理解和区分这些概念。1. 原木(RawWood)定义:原木是指直接从树木中砍下来的粗大木材,未经任何加工。它通常是树干或大树枝,外形不规则,......
  • python库asyncio的概念和用法
    python库asyncioasyncio是Python的标准库之一,用于编写异步应用程序。它提供了事件循环、协程、任务和其他工具来处理并发操作。以下是一些关于asyncio的基本概念和常见用法:基本概念协程(Coroutine):协程是一种特殊的函数,可以暂停执行并在稍后恢复。在Python中,协程......
  • 【模块一】kubernetes容器编排进阶实战之k8s基础概念
    kubernetes基本介绍kubernetes组件简介   -master:       主人,并不部署服务,而是管理salve节点。      后期更名为:controllplane,控制面板。         etcd:      2379(客户端通信)、2380(集群内部通信)         ......
  • 概念
    概念TransformerTransformer是Google的团队在2017年提出的一种NLP经典模型,现在比较火热的Bert也是基于Transformer。Transformer模型使用了注意力机制(attentionmechanisms),不采用RNN的顺序结构,使得模型可以并行化训练,而且能够拥有全局信息Transformer使用的是E......
  • 【DL】CAM | 与嵌入的概念相比,图像中有什么相似或不同之处?| 热力图可视化 | python |
    本文将采用像素属性方法嵌入模型输出(Adaptingpixelattributionmethodsforembeddingoutputsfrommodels)的实践。话不多说,先看看效果吧!!!目录1安装pytorch-gradcam2实践① 代码② 效果图“与嵌入的概念相比,图像中有什么相似或不同之处?”为了实现这一点,将创建......
  • 数据分析基础概念1
    一、什么是数据分析?观测、实验、应用二、重新认识数据分析观测:对实物形成客观量化的认知(报表、图表、仪表盘)实验:发现规律、验证假设(科学研究、A/B实验)应用:不断基于数据反馈迭代产品;基于数据训练算法,让机器自动化地完成工作三、观测采集数据、储存数据、展示数据1、采......
  • 调度的概念与层次
    调度的概念与层次‍​​‍一、调度解决的问题理解:在资源有限不能同时处理所有任务的情况下,需要确定某种规则来确定处理这些任务的顺序(划分权级或短时优先或其他等)‍二、调度的层次划分​​‍(一)高级调度/长程调度/作业调度内存的空间有限,无法将所有任务同时装入内存。......
  • 线程的概念、作用和属性
    线程的概念、作用和属性线程的概念理解:线程可视作“轻量级进程”。线程是一个基本的CPU执行单元,也是程序执行流的最小单位。引入线程之后,不仅是进程之间可以并发,进程内的各线程之间也可以并发,从而进一步提升了系统的并发度,使得一个进程内也可以并发处理各种任务(如QQ视频、文......
  • 鸿蒙开发进阶(HarmonyOS )Form Kit(卡片开发服务)概念
     鸿蒙NEXT开发实战往期必看文章:一分钟了解”纯血版!鸿蒙HarmonyOSNext应用开发!“非常详细的”鸿蒙HarmonyOSNext应用开发学习路线!(从零基础入门到精通)HarmonyOSNEXT应用开发案例实践总结合(持续更新......)HarmonyOSNEXT应用开发性能优化实践总结(持续更新......)FormKi......
  • 进程的概念、组成、特征
    进程的概念、组成、特征‍​​‍一、进程与程序程序:是静态的,是存放在磁盘里的可执行文件,是一系列的指令集合。进程:是动态的,是程序的一次执行过程(同一个程序多次执行会对应多个进程,分配不同的进程号PID)‍二、进程的组成(PCB给操作系统使用,程序段和数据段给进程自己使用)......