第六章——亲自尝试压缩数据
压缩文件扩展名LZH和ZIP等。
1.文件以字节为单位保存
文件就是字节数据的集合,用1个字节表示的字节数据有256种,二进制来表示的话范围就是00000000~11111111。
2.RLE算法的机制
用“数据*重复次数”的形式表示就属于RLE算法压缩的文件。
RLE(行程长度编码)
3.RLE算法的缺点
适合字符重复出现的情况,例如相同数据经常连续出现的图像、文件,但不适合文本文件的压缩。
原因:文章中字符大量连续出现的情况不多见,文本文件使用RLE算法压缩后反而文件更大。
4.哈夫曼算法
哈夫曼算法的关键是“多次出现的数据用小于8位的字节数来表示,不常用的数据可以用超过8位的字节数来表示。”
注意:不管是否满8位的数据,最终都会以8位为单位保存在文件中。
哈夫曼算法:为各压缩对象文件分别构造最佳的编码体系,并以该编码体系为基础进行压缩。用哈夫曼算法压缩后的文件中,存储着哈夫曼编码信息和压缩后的数据。
哈夫曼算法能够大幅提升压缩比率。
5.可逆压缩和非可逆压缩
图像文件的压缩:
可以还原到压缩前的状态的压缩称为可逆压缩,无法还原到压缩前的状态的压缩称为非可逆压缩。
以上为本章所学内容,下章见!
标签:文件,有感,哈夫曼,RLE,压缩,程序,算法,第六章,数据 From: https://www.cnblogs.com/zyk0915-/p/18038341