读完第六章后,我了解到文件是以字节为单位来保存的,文件的大小之所以用KB、MB等来表示,就是因为字节用B来表示。文件用来压缩是可以使用RLE算法机制的。RLE算法是用“数据”*“重复次数”来压缩的,它比较适用字节重复较多的文件,并不适合文本文件的压缩。用哈夫曼算法也可以压缩文件。哈夫曼算法是哈夫曼(D.A.Huffman)于1952年提出来的压缩算法。日本人比较常用的压缩软件LHA",使用的就是哈夫曼算法。哈夫曼算法的关键就在于“多次出现的数据用小于8位的字节数来表示,不常用的数据则可以用超过8位的字节数来表示”。例如A和Q都用8位来表示时,原文件的大小就是100次x8位+3次x8位=824位,而假设A用2位、0用10位来表示,压缩后的大小就是100次x2位+3次x10位=230位。由此看来,哈夫曼算法也极有用处。此外,用二叉树也可以实现哈夫曼算法,。另外,压缩文件也分可逆压缩和非可逆压缩。压缩完之后不可恢复就叫非可逆压缩,可以恢复就叫可逆压缩。
标签:字节,哈夫曼,可逆,压缩,压缩文件,算法,数据 From: https://www.cnblogs.com/Lxz1/p/18044192