《程序是怎样跑起来的》第六章讲的主要是亲自尝试压缩数据,我们可以学习到程序文件中的数据是如何以字节为单位存储在磁盘等存储媒介中的。
文件是字节数据的集合。本章介绍了文件存储的基本单位——字节,1字节表示的字节数据有256种,用二进制数来表示的话,其范围就是00000000~11111111。把文件内容用“数据乘以重复次数”的形式来表示压缩的方法称为RLE算法。它常用于压缩传真的图像。RLE算法也会有缺点,在实际文本中,同样字符多次重复出现的情况并不多见。但是它并不适合文本文件的压缩。例如它在面对非重复或重复次数较少的数据时效率不高。这一点让读者认识到,没有一种压缩算法能够适应所有情况,选择合适的压缩算法需要根据具体的数据特性来决定。
压缩技巧还有哈夫曼算法、二叉树可以实现哈夫曼编码,它还能够大幅提升压缩比率。可逆压缩是把能还原到压缩前状态的压缩,不可逆压缩是无法还原到压缩前状态的压缩。本章的实践性质很强,它鼓励读者亲自尝试压缩数据,通过动手实践来加深对数据压缩原理的理解。这种学习方式能够让理论知识与实际操作相结合,提高学习效果。
阅读了《程序是怎样跑起来的》第六章,我对于压缩数据有了一定的了解,我也学习到了压缩的很多技巧,来帮助我以后对于编程的学习。