读了本章之后,我知道了在文件中存储数据的基本单位是1字节;在doc、zip、txt这些文件扩展名中,代表压缩文件的是zip;在Windows计算机经常使用的Shift-JIS编码中,一个半角英文或数字字符需要1字节的数据来表示;BMP格式的图片文件不经过压缩;压缩后的数据可以恢复成原始数据的是无损压缩,不能恢复成原始数据的是有损压缩。
JPEG格式的文件采用了有损压缩因此会损失一部分信息,导致图像变得模糊。GIF格式的文件虽然采用了无损压缩,但它最多只能存储256种颜色,由此损失了一部分颜色信息,导致图像失真。PNG格式的文件采用了无损压缩,而且能够存储与BMP格式相同数量的颜色,因此图像能够保持原状。
本章讲解了文件的压缩,当文件太大放不下时,会采用文件压缩的方法。文件是以字节为单位存储的,文件其实就是字节数据的集合,字节数据是连续存储的。用“数据 * 重复次数”的形式来表示的压缩方法为游程编码,该算法经常用于压缩传真的图像,该算法的缺点是不适合进行文本文件的压缩,第二种压缩算法哈夫曼算法指为压缩对象文件分别构造最佳的编码体系并以该编码体系为基础来进行压缩,把出现的数据用大于或小于8位的字节表示,而后又通过莫尔斯编码进一步了解了哈夫曼算法通过哈夫曼树可以更另方便的压缩,能大幅提高压缩比率。