base64编码和解码

时间：2023-01-03 12:35:21浏览次数：70

标签：编码 Base64 字节二进制解码 base64

引言：最近做爬虫的时候，解析对方网站中自定义字体时遇到的base64解码问题，对这个一直不理解，今天学习一下，总结一下。

base64

Base64是一种任意二进制到文本字符串的编码方法，基于64个可打印字符来表示二进制数据的方法。

例如迅雷的下载链接就就行了base64编码。

迅雷专用地址：thunder://QUFodHRwOi8vc29zb2J0LmNvbS9aWg==
真是文件下载链接：http://sosobt.com/

简述

Base64编码就是从二进制到字符的过程。

采用Base64编码具有不可读性，需要解码后才能阅读。

标准的Base64并不适合直接放在URL里传输，因为URL编码器会把标准Base64中的/和+字符变形为形如"%xx"的形式。

Base64是一种通过查表的编码方法，不能用于加密，即使使用自定义的编码表也不行。

Base64适用于小段内容的编码，比如数字证书签名、Cookie的内容等。

优点： 速度快，ascii字符，肉眼不可理解
缺点： 编码比较长，非常容易被破解，仅适用于加密非关键信息的场合

原理

用一句话概述就是：把3字节的二进制数据编码成4字节的文本数据。

如果编码的二进制数据不是3的倍数，最后剩下1个或2个字节的时候，用\x00字节在末尾补足后，再在编码的末尾加上1或2个=号，表示补了多少字节，解码的时候会自动去掉。

内存一个字节占8位。

转之前：s13

转为ascii：115 49 51

转为二进制：01110011 00110001 00110011

6位为一组(4组)：011100 110011 000100 110011

高位补0(一组八位)：00011100 00110011 00000100 00110011

得出10进制：28 51 4 51

查表找出对应字符：c z E z

Python中的base64

需要import base64这个module，

该module中有6个函数用于Base64的编码和解码，分成三组来说：

base64.b64decode(s, altchars=None, validate=False) 解码
base64.b64encode(s, altchars=None) 编码

altchars参数必须是长度为2的字节包，会用于替换编码后数据中的+和/。

validate参数默认为False，如果为True，在解码前会检验s中是否有非base64字母表中的字符，如果有的话，报错。

base64.standard_b64encode(s)base64.standard_b64decode(s)

这一组方法分别对应上一组方法(相当于b64decode(s)、b64encode(s))

base64.urlsafe_b64decode(s)

base64.urlsafe_b64encode(s)

该组编码后会将输出数据中的’+’和’/’替换为’-‘和’’。解码前则将数据中的’-‘和’’替换为’+’和’/’。(适合在URL中用)

参考资料

廖雪峰官方网站

base64-百度百科

标签：编码,Base64,字节,二进制,解码,base64
From： https://blog.51cto.com/u_13758447/5985261

VLQ & Base64 VLQ 编码方式的原理及代码实现
VLQ&Base64VLQ编码方式的原理及代码实现目录VLQBase64VLQ VLQVLQ (Variable-lengthquantity)是一种通用的，使用任意位数的二进制来表示一个任意......
202209-1 如此编码
题意：第一行给定n和m，表示有n个题目，m表示依据这n个题目的答案计算的结果。第二行给定n个数A1,A2,……An，表示n个题目各自的选项个数。开辟A,B,C三个大小均为n+1的数组。Ci =......
【李宏毅机器学习】自编码器auto-encoder
note:VAE的本质结构：重构的过程是希望没噪声的，而KLloss则希望有高斯噪声的，两者是对立的。所以，VAE跟GAN一样，内部其实是包含了一个对抗的过程，只不过它们两者是混合起来，共......
字符编码：Unicode & UTF-16 & UTF-8
ASCII码使用一个字节（8位），对128个字符进行编码；最高位始终为0；码数范围为0000_0000(0x00)到0111_1111(0x7F)；Unicode开始的编码设计使用两个字节（16位），对65536个字符进行编......
第九章《字符串》第5节：字符编码常识
专业上，把有公认意义的符号称之为“字符”，而一组字符形成的集合被称为“字符集”。字符集当中的每一个字符都有唯一的序号，这个序号是一个整数，用来和其他字符进行区别。内存......
免杀——凯撒+RC4+Base64分离免杀
Shellcode生成器：buf是CS生成的Shellcode#include"Caesar.h"#include"Base64.h"#include"RC4.h"intmain(){ unsignedcharbuf[]="" unsignedchar......
基于Alamouti 空间时间分组编码模拟瑞利衰落信道 BPSK 调制并计算误码率附matlab完整
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，matlab项目合作可私信。......
密码学——Base64编码
通过数据表替换，将6位拓展为8位，进行替换，总长度增加1/3。 #pragmaonce#include<stdio.h>#include<stdlib.h>#include<string.h>unsignedchar*Base64_Encode(un......
m基于matlab的MIMO信道容量分析,对比了不同天线数量；非码本预编码SVD,GMD；码本预编码DFT
1.算法概述·MIMO信道容量平均功率分配的MIMO信道容量：通过Matlab仿真在加性高斯白噪声情况下的SISO(11)、SIMO(16)、MISO(41)、MIMO(33)、MIMO（4*4）系统的信道容量进行分析......
m基于matlab的MIMO信道容量分析,对比了不同天线数量；非码本预编码SVD,GMD；码本预编码DFT
1.算法概述·MIMO信道容量平均功率分配的MIMO信道容量：通过Matlab仿真在加性高斯白噪声情况下的SISO(1*1)、SIMO(1*6)、MISO(4*1)、MIMO(3*3)、MIMO（4*4）系统的信道容量......

base64编码和解码

base64

简述

原理

Python中的base64

参考资料

相关文章

赞助商

阅读排行