编码和解码的目的
编码:为了让机器能够识别人类的语言==即将字符数字化化成一个一个的二进制数。
解码:反过来。
由于语言的不同,诞生许多的编码类型,毕竟又不只有英语。
不同的编码格式
1. ASCIl编码
一个字符or字母用一个字节表示
将英文世界中的字母和其他符号(如 ! @ # 这类字符)用计算机中的一个字节来表示。
例如
小写字母a
的二进制数为0110 0001
2.GB2312编码
一个字符用二个字节表示
产生原因:为了解决无法识别汉字的问题
可以兼容ASCll
3.Unicode编码
一个字符or字母用二个字节表示
产生原因:为了统一每个国家特有的文字。
相当于国际通用编码器 日语法语啥统统识别。
问题:过于浪费空间。
4.utf-8编码(Unicode Transformation Format-8bit)
一个字符or字母用一个字节表示.一个汉字用二个字节表示
产生原因:unicode的简化版(用于英文字符居多的情况)。
一般运用在存储和传输的情形下。
但由于中英文编码字节长度不同,如使用在内存中会十分复杂(内存中多使用Unicode)。
5.GBK编码
GB2312编码的升级版,也支持希腊字母、日文假名字母、俄语字母等字符。
补充(关于编码的相互转换)
GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换
标签:编码,字节,字符,不同,字母,GB2312,Unicode From: https://www.cnblogs.com/a111l/p/16649449.html