前面讲述了内存跟磁盘,而内存跟磁盘里面的储存量也是有限的,那么我们就需要去压缩数据,而数据该怎么压缩呢?第6章就为我们介绍了。首先要了解文件中储存数据的格式文件是在磁盘等储存媒体中储存数据的一种形式,程序是以字节为单位向文件中储存数据的储存在文件中的数据。如果表示字符,那这个文件就是一个文本文件,如果表示图案,那这个文件就是一个图片文件,但无论如何我们都可以认为文件就是一串连续储存的字节数据。文件压缩有多种方式,第1种将文件内容用数据乘以重复次数来表示的压缩方式称为游程编码,游程编码常用在传真的图像压缩等领域但他也是有缺点的,因为邮政编码适合连续重复的多种情况而在平常中较少出现重复的情况,所以它并不适合用来压缩文本文件。第2种方法就是哈夫曼算法zip格式也是使用哈弗曼算法来进行压缩的。而对哈夫曼算法解释之前,又向我们解释了莫尔斯曼的算法。莫尔斯曼是根据字母在一般文本中的出现频率来确定他们的编码长度的哈弗曼算法的要点是根据不同的压缩对象文件来构建最优的编码系统,并基于这一编码系统来进行压缩。哈弗曼算法使用哈弗曼数来构建编码系统,从而实现了不用分割符就能区分字符的编码系统。而压缩也分为无损压缩和有损压缩。能够恢复到压缩前状态的压缩方式,称为无损压缩,不能恢复到压缩前状态的压缩方式,称为有损压缩,要记住文本文件是不能使用有损压缩的。
标签:编码,储存,文件,压缩,读书笔记,程序,算法,弗曼,怎样 From: https://www.cnblogs.com/shy1226/p/18031081