Huffman编码

时间：2022-10-10 15:33:59浏览次数：48

§5. 哈夫曼(Huffman)编码

哈夫曼编码是用于数据文件压缩的一个十分有效的编码方法，其压缩率通常在20％

～90％之间。哈夫曼编码算法使用字符在文件中出现的频率表来建立一个0,1串，以表

示各个字符的最优表示方式。下表给出的是具有100,000个字符文件中出现的6个不同

的字符的出现频率统计。

表 5.1 字符出现频率表

不同的字符	a	b	c	d	e	f
频率（千次）	45	13	12	16	9	5
定长码	000	001	010	011	100	101
变长码	0	101	100	111	1101	1100

如果采用定长码，则每个字符至少需用三位，该文件总共需要300,000位；如果采用

上面所列变长码，则该文件需用

（45×1＋13×3＋12×3＋16×3＋9×4＋5×4）×1000＝224,000位，

总码长减少了25%。

一般的编码都是沿一个方向连续地写下0,1子串，比如从左到右、从上到下。解码

时也是以同样的方向逐字地搜索。为了使解码唯一，必须使用一个规则。前缀码即是一

种规则，它要求表示任何一个字符的0,1字串都不能是表示另一个字符的0,1字串的前

部。比如，若用01表示字符a，则表示其它字符的字串不能是具有形式：01…。可以

用一棵二叉树来表示前缀编码的数据结构。用树叶代表给定的字符，并将给定字符的前

缀码看作是从树根到代表该字符的树叶的一条道路。代码中每一位的0或1分

标签：编码,前缀,哈夫曼,字符,000,字串,Huffman
From： https://blog.51cto.com/u_15815923/5743800

图像课设Huffman编码
它是一种编码方式，哈夫曼编码是可变字长编码(VLC)的一种。Huffman于1952年提出一种编码方法，该方法完全依据字符出现概率来构造异字头的平均长度最短的码字，有时......
字符编码
计算机是由美国人发明的，所以美国人要把他们使用的语言字符告诉计算机，由计算机进行存储，他们将使用的小写字母、大写字母、符号、数字进行边编排，每个对应一个数字，我们叫一个......
纠错编码-海明码计算与校验原理
简单介绍海明码是一种纠错编码，也就是发送海明码给接收端后，如果传输过程出错，接收端根据收到的码的特征，可以判断出是否出错，并且知道如何纠正出错的位(bit)。接下来介绍给出......
Python中使用Mysql（编码实践）
文档或者看源码http://mysql-python.sourceforge.net/MySQLdb-1.2.2/public/MySQLdb-module.html开篇在上一篇Python中使用Mysql（安装篇）中，我们为Python安装了支持My......
行程压缩编码
行程压缩编码RLE(RunLengthEncoding)，是一种无损压缩算法。算法特点：简单、易实现、压缩和解压缩效率高。利用控制字节的最高位来标识是否进行了压缩：最高位是1时，后7位......
go控制台输出乱码-go执行命令输出乱码-编码bytes为gbk字符串
go控制台输出乱码|go执行命令输出乱码|编码bytes为gbk字符串1、问题描述使用go运行ping命令时，输出乱码，现象如下代码packagemainimport("fmt""os/exec"......
闪存——磨损均衡、垃圾回收、数据压缩、纠错编码
1.闪存如图所示，闪存由多个颗粒（Die）组成，每个颗粒由多个分组（Plane）组成，每个分组由多个块（Block）组成，每个块由多个页（Page）组成。块是擦除的基本单位。页是读写的基本单位。当一个......
编码之ASCII，UTF-8（Unicode），GBK，GB2312
编码之ASCII，UTF-8（Unicode），GBK，GB2312编码计算机中的编码，通俗的讲就是字符怎样在计算机中的表示和存储。要弄明白编码，就要清楚这里的表示和存储这两个概念：表示，也就是说的各......
哈夫曼编码
背景假如我们要传输一段文本，比如“hello”，怎么办？最容易想到的方法是，直接依次传输每个字符的Unicode，每个字符都用8个比特来传输。这样就需要5*8=40个比特来传输。但是如果......
【Java基础】字符串、字符流中的编码解码问题、字符流写数据的5种方式、字符流读数据
目录一、字符串中的编码解码问题二、字符流中的编码解码问题三、字符流写数据的5种方式四、字符流读数据的2种方式五、字符流复制Java......

Huffman编码

相关文章

赞助商

阅读排行