首页 > 其他分享 >信息论与编码(二)| 自信息与信息熵

信息论与编码(二)| 自信息与信息熵

时间:2022-09-30 16:39:17浏览次数:55  
标签:不确定性 编码 信息量 信息 信源 信息熵 事件 信息论

自信息

信息量

如何考察或计算信源输出的消息(或者符号)的信息量?

  • 信源的信息实质:不确定性(信源输出的是消息,消息的内涵是信息。信源输出一个符号,我们认为发生一个事件)。
  • 数学上我们用概率(或概率密度)来表征事件不确定性的大小。

1.信息量的大小与不确定性的消除多少有关;

收到某消息获得的信息量=不确定性的减少量=(收到该消息前关于某事件发生的不确定性)-(收到此消息后关于某事件发生的不确定性)

2.信道无噪声,收到某消息获得的信息量=收到该消息前关于某事件发生的不确定性=信源输出的某消息中所含的信息量。

3.概率小→不确定性大;概率大→不确定性小。

因此,某事件发生所含的信息量应该是该事件发生的先验概率的函数。

自信息定义

事件集合 中的事件 的自信息定义为 或记为:

注意 1 : 要求 I(x) 非负. 所以对数的底数必须大于 1 .

  • 底数为 2 , 单位为比特 (bit) ;
  • 底数为 \mathrm{e} , 单位为奈特 (Nat);
  • 底数为 10 , 单位为笛特(Det)。

1 bit =0.693 Nat =0.301 Det

注意2: I(x) 是随机变量.

自信息的含义:

  • 在事件发生前, 自信息表示事件发生的不确定性。
  • 在事件发生后, 自信息表示事件所包含的信息量, 是提供给信宿的信息量, 也是解除这种不确定性所需要的信息量

联合自信息

联合事件集合 中的事件 的自信息定义为

其中, p(x y) 要满足非负和归一化的条件。

条件自信息

事件 在事件 给定条件下的自信息定义为

-条件自信息的含义 -在事件 给定条件下, 在 发生前的不 确定性; -在事件 给定条件下, 在 发生后所得到的信息量。

Example 3有8×8=64个方格,甲将一棋子放入方格中,让乙猜。 1、将方格顺序编号,让乙猜顺序号的难度程度如何? 2、将方格按行和列编号,当甲告诉乙方格的行号后,让乙猜列顺序号的难度如何?

信息论与编码(二)| 自信息与信息熵_顺序号_15

-解:两种情况的不确定性:

信息熵

信源符号自信息的数学期望为信源的平均信息量一信息熵

注意: \mathbf{H}(\mathbf{X}) 是一个数, 不是随机变量.

Example 3 请计算下述离散无记忆二进制信源的信息熵。 Solution

信息熵的物理含义

1.信息熵H(X)表示信源输出后,每个消息(符号)所提供的平均信息量;

2.信息熵H(X)表示信源输出前,信源的平均不确定性;

3.用信息熵H(X)来表征变量X的随机性。

注:信息熵不等于平均获得的信息量。一般情况下获得的信息量是两熵之差,而不是信息熵本身。

Example4:

甲地天气预报, 乙地天气预报 求:两地天气预报各自提供的平均信息量

解:

  • 甲地提供的平均信息量大于乙地。

甲、乙地天气预报为两极端情况:

  • 信源是确定信源, 所以不存在不确定性, 信息熵等于零。

甲、乙地天气预报为两极端情况:

  • 这种情况下,信源的不确定性最大,信息熵最大
  • 甲地比乙地提供更多的信息量。因为甲地可能出现的消息数多于可能出现的消息数, 不确定性更大。

结论: 信源熵大于等于0(若信源输出为确定符号)而小于等于log(N)(信源输出的不确定性最大)。 0≤H(X)≤ log(N) 其中N为信源字符集元素的个数

Example 5 某信号带宽为4000Hz ,以奈奎斯特速率抽样。假设其抽样序列可以建模成一个字符集为A={-2,-1,0,1,2}的DMS,相应的概率为{1/2,1/4,1/8,1/16,1/16},求信源的速率(b/s)

其中   为信息速率。 注:奈奎斯特抽样速率为 2


标签:不确定性,编码,信息量,信息,信源,信息熵,事件,信息论
From: https://blog.51cto.com/u_15736437/5727068

相关文章

  • 信息论与编码(三)| 联合熵和条件熵
    联合熵和条件熵联合熵联合集XY上,对联合自信息的平均值称为联合熵:当有n个随机变量,有信息熵与热熵的关系信息熵的概念是借助于热熵的概念而产生的。1.信息......
  • 【尚硅谷】Vue2.x组件化编码学习笔记--渐进式的JS框架
    Vue组件化编码​​一、使用Vue-cli创建项目​​​​1.1说明​​​​1.2创建Vue项目​​​​1.2.1如何修改端口以及自动运行​​​​1.3Vue-cli创建的项目的目录结构​​......
  • C# Unicode编码解码
    Unicode是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的......
  • 编码技巧 6
    编码技巧6不确定您是否会使用它,但以防万一您遇到想要借助脚本检查特定字段的依赖字段的情况,您可以使用以下脚本:vargtd=newGlideTableDescriptor('事件');vared=......
  • one-hot编码
    优点:(1)解决了分类器不好处理离散数据的问题。a.欧式空间。在回归,分类,聚类等机器学习算法中,特征之间距离计算或相似度计算是非常重要的,而我们常用的距离或相似度的......
  • RabbitMQ 入门系列:5、基础编码:交换机的进阶介绍及编码方式。
    系列目录​​RabbitMQ入门系列:1、MQ的应用场景的选择与RabbitMQ安装。​​​​RabbitMQ入门系列:2、基础含义:链接、通道、队列、交换机。​​​​RabbitMQ入门系列:3、基础......
  • drf请求与相应(Request,Response),drf能够解析的请求编码,响应编码,GenericAPIView和APIVi
    drf请求与响应Request类(请求)Response类(响应)drf 能够解析的请求编码,响应编码能够解析的请求编码响应编码GenericAPIView和APIView(2个视图基......
  • 编码规范(本文档属于半成品)
     引言1.1  编写目的这是一份旨在增强团队的开发协作,提高代码质量和打造开发基石的编码风格规范。目前其中包含了HTML、JavaScript和css/scss几个部分。 1.2  项目背......
  • CentOS7.6 修改文件编码
    概述程序读取经纬度坐标配置文件,经纬度坐标要求格式为度分秒格式。程序读取到的文件内容写入到另一个文件后,新文件乱码。分析查看文件编码格式:file--mime-fileencodingxx......
  • iOS小技能:地理编码(地址转坐标)
    前言需求:手动输入位置信息需要进行地理编码获取经纬度,判断是否为国内地址。I高德位置服务:地理编码(地址转坐标)用户在高德地图官网申请Web服务API类型Key:https://lbs.amap......