一、BASE编码
1、Base64
Base64是网络上最常见的用于传输8Bit字节码的编码方式之一,Base64就是一种基于64个可打印字符来表示二进制数据的方法。
Base64,就是包括小写字母a-z、大写字母A-Z、数字0-9、符号"+“、”/"一共64个字符的字符集。
(1)编码规则
①把3个字节变成4个字节。
②每76个字符加一个换行符。
③最后的结束符也要处理
(2)举例说明
转前: s 1 3
先转成ascii:对应 115 49 51
2进制: 01110011 00110001 00110011
6个一组(4组) 011100110011000100110011
然后才有后面的 011100 110011 000100 110011
然后计算机一个字节占8位,不够就自动补两个高位0了
所以有了高位补0
科学计算器输入 00011100 00110011 00000100 00110011
得到 28 51 4 51
查对下照表 c z E z
原文的字节数量应该是3的倍数,如果这个条件不能满足的话,具体的解决办法是这样的:原文剩余的字节根据编码规则继续单独转(1变2,2变3;不够的位数用0补全),再用=号补满4个字节。这就是为什么有些Base64编码会以一个或两个等号结束的原因,但等号最多只有两个。因为一个原字节至少会变成两个目标字节,所以余数任何情况下都只可能是0,1,2这三个数中的一个。如果余数是0的话,就表示原文字节数正好是3的倍数(最理想的情况)。如果是1的话,转成2个Base64编码字符,为了让Base64编码是4的倍数,就要补2个等号;同理,如果是2的话,就要补1个等号。
转前: s 1
先转成ascii:对应 115 49
2进制: 01110011 00110001
6个一组 011100 110011 000100
高位补0
科学计算器输入 00011100 00110011 00000100
得到 28 51 4
查对下照表 c z E
等号补满4个字节c z E =
(3)编码特征
末尾有一个或两个=,由大小写字母,+,/符号组成,示例如下
6I+c5qC5572R5ZKv5a6J5YWo5p2C6LCIQ2FpZ2Vuc2Vj
5pyr5bC+5pyJ5LiA5Liq5oiW5Lik5LiqPe+8jOeUseWkp+Wwj+WGmeWtl+avje+8jCvvvIwv56ym5Y+357uE5oiQ77yM56S65L6L5aaC5LiLLg==
2、Base32
Base32使用了ASCII编码中可打印的32个字符(大写字母AZ和数字27)对任意字节数据进行编码
(1)编码规则
输入:任意长度的二进制数据。
转换:将二进制数据每5位分为一组,每组转换为对应的base32字符。如果最后不足5位,则用0填充。
输出:由base32字符组成的字符串,通常包含等号(=)作为填充标记。
(2)编码特征
只包含大写字母和数字2-7,末尾有=
3、Base16
base16编码,使用16个字符(0-9和A-F)来表示二进制数据。
(1)编码规则
输入:任意长度的二进制数据。
转换:将二进制数据每4位分为一组,每组转换为对应的十六进制字符。
输出:由十六进制字符组成的字符串。
(2)编码特征
只包含数字和A-F字母。
二、URL编码
URL编码是一种将URL中的特殊字符转换为可被浏览器和服务器接受的ASCII字符的编码方式。
1、编码规则
- 将字符转换为其ASCII码值:例如,字符A的ASCII码值是65。
- 将ASCII码值转换为十六进制数:例如,65转换为十六进制数是41。
- 在十六进制数前面加上%符号,得到URL编码。例如,字符A的URL编码是%41
2、编码特征
(1)常见的编码
空格 %20
%:23
&:%26
+:%2B
%:%25
?:%3F
/:%2F
=:%3D
,:%2C
$:%24
":%22
':%27
(2)编码特征
%后跟两个字符,数字或字母,示例:
user%3D1%27%20or%201%3D1
三、Uicode编码
Unicode 是国际标准字符集,它将世界各种语言的每个字符定义一个唯一的编码,以满足跨语言、跨平台的文本信息转换.
Unicode包含UTF-8、UTF-16、UTF-32,不过我们这里不需要深入了解,只需要碰到Unicode编码的时候能认出来就行。
1、编码特征
\u开头,后跟数字,比如
Caigensec的Unicode编码为\u0043\u0061\u0069\u0067\u0065\u006e\u0073\u0065\u0063