又到了读书分享的时候,本篇分享《程序是怎样跑起来的》第六章的读后感,亲自尝试压缩数据。文件是将数据存储在磁盘等存储媒介中的一种形式。程序文件中存储数据的单位是字节。文件的大小之所以用××KB、××MB等来表示,就是因为文件是以字节(B=Byte)为单位来存储的。文件就是字节数据的集合。用1字节(=8位)表示的字节数据有256种,用二进制数来表示的话,其范围就是00000000~11111111。如果文件中存储的数据是文字,那么该文件就是文本文件。如果是图形那么该文件就是图像文件。在任何情况下,文件中的字节数据都是连续存储的。把文件内容用"数据×重复次数"的形式来表示的压缩方法称为RLE(运行长度编码,行程长度编码)算法,但它并不适合文本文件的压缩。哈夫曼算法是哈夫曼于1952年提出来的压缩算法。哈夫曼算法是指,为各压缩对象文件分别构造最佳的编码体系,并以该编码体系为基础来进行压缩。使用哈夫曼树后出现频率越高的数据所占用的数据位数就越少,而且数据的区分也可以很清晰的实现。通过借助哈夫曼树构造编码体系,即使在不使用字符区分符号的情况下,也可以构建能够明确进行区分的编码体系。但这与RLE算法相比,程序的内容要复杂很多。我们把能还原到压缩前状态的压缩成为可逆压缩,无法还原到压缩前状态的压缩成为非可逆压缩。
标签:读后感,编码,字节,哈夫曼,文件,压缩,程序,第六章,数据 From: https://www.cnblogs.com/suyibing/p/18021884