1. HTTP 的缺点
在正式介绍 HTTPS 前我们先来看看 HTTP 协议当前存在的三大缺点:
- 机密性问题:通信使用了明文,第三方可以拦截并获悉通信内容;
- 完整性问题:未验证报文的完整性,第三方可以篡改通信内容;
- 认证问题:未验证对方的身份,第三方可以冒充他人身份参与通信。
注:其他未加密协议也会存在以上问题,比如 Telnet、FTP。
HTTP 工作原理:
为了解决以上三个问题,便诞生了 HTTPS。
2. HTTPS 简介
HTTPS 被称为 HTTP Over SSL(基于 SSL 加密的 HTTP),这里的 SSL(Secure Socket Layer)被称为安全套接层,它是一种加密协议,不仅可应用于 HTTP 协议、还可应用于 POP3 协议、SMTP 协议、VPN 等。
TLS(Transport Layer Security) 被称为传输层安全,TLS 相对于 SSL 3.0 版本做了些修改和功能增强,相当于 SSL 的升级版本,所以有时也一起统称为 SSL,接入来本文若不明显强调,SSL 就默认表示 SSL/TLS。
我们可以用公式 HTTPS = HTTP + SSL/TLS 来表示 HTTPS。
3. HTTPS 交互流程
接下来用 Wireshark 工具抓了客户端与百度网站(https://www.baidu.com)的 TLS 握手过程,可以看到下图中红色方框圈中 4 次 TLS 握手报文。
我们知道,HTTPS 协议是基于 TCP/IP 协议的,所以在 TLS 握手前后客户端与百度服务器分别进行了 TCP 三次握手(69、70、71)和 TCP 四次挥手(95、99、103、105)。
为了方便大家先从整体再到细节理解整个HTTPS交互过程,这里画一个HTTPS整体交互流程图(整体划分四个阶段)。每个交互细节会在接下来的介绍中持续展开,循序渐进。
HTTPS的四个交互阶段:
3.2. 阶段二:TLS握手建立安全通道
在 Wireshark 的显示过滤器中输入表达式 ip.addr == 36.155.132.3 and tls 过滤出 TLS 协议数据包。
- 第一次握手报文(72):我 ->百度 发送 TLS 消息「Client Hello」;
- 第二次握手报文(74、79):
- 百度 -> 我 发送 TLS 消息「Server Hello」;
- 百度 -> 我 发送 TLS 消息「Certificate」,「Server Key Exchange」,「Server Hello Done」
- 第三次握手报文(83):我 ->百度 发送 TLS 消息「Client Key Exchange」,「Change Cipher Spec」,「Encrypted Handshake Message」
- 第四次握手报文(85):百度 ->我 发送 TLS 消息「Change Cipher Spec」,「Encrypted Handshake Message」
为了直观展示 TLS 报文交互,基于抓包分析的数据包可以绘制得到下图。
3.2.1. TLS 第一次握手:client -> server (Client Hello)
客户端向服务端发送:
- 客户端支持的协议;
- 已经使用的 TLS 版本;
- 随机数 Random;
- 支持的密码套件。
从下图中,我们也可以看出 SSL 层是基于 TCP 层又进行封装的一层协议。
接下来我们看几个 TLS 协议中的重要字段(Version、Random、SessionID 和 Cipher Suites)。
3.2.1.1. version
从上图中可以看到当前通信安全层协议版本(Version)为 TLS 1.2。其实 TLS 共总有4个版本,最新为 TLS 1.3,具体如下:
- TLS 1.3:发布于2018年,TLS 1.3是TLS协议的最新版本,大幅简化了握手过程,提高了性能和安全性。它删除了一些不安全的加密算法,并引入了0-RTT(零往返时间)握手,以减少延迟。
- TLS 1.2:TLS 1.2发布于2008年,它引入了更强的加密算法和更灵活的密码套件选择,修复了许多安全漏洞,是目前广泛使用的版本。(当前样例中百度网站使用的就是TLS 1.2协议)
- TLS 1.1:TLS 1.1发布于2006年,引入了一些改进,包括对CBC(Cipher Block Chaining)模式的安全性改进,但仍然存在一些已知的安全问题。
- TLS 1.0:TLS 1.0于1999年发布,是SSL 3.0的升级版本,修复了一些安全漏洞,但仍然存在一些安全问题。
3.2.1.2. Random
Random 用于密钥的制作。这里我们将第一次握手中客户端发送给服务端的随机数记为 Client Random,记住这个随机数,后面还会用到。
3.2.1.3. SessionID
SessionID 用来表示客户端是否想复用先前存在的 session。如果不复用,则此字段为 0;如果想要复用,则此字段为想要复用的 sessionID。是否复用由服务端确定。
3.2.1.4. Cipher Suites
密码套件列表会全部发给服务端,服务端从中挑选一个最安全的密码套件返回客户端。
将 Cipher Suites 字段展开,如下图。代表客户端支持的密码套件列表。由于本次抓包使用的是 curl 工具,我们可以看到里面支持 49 种密码套件。每种套件代表不同的加密方式。不同的客户端(如浏览器)支持的列表也可能不一样。
密码套件的格式通常由一系列的加密算法和相关参数组成。一般来说,它的格式包含以下几个部分:
- 密钥交换算法:用于协商会话密钥,例如 Diffie-Hellman(DHE)、ECDHE 等。
- 身份验证算法:也称签名算法用于验证对端身份,例如 RSA。
- 加密算法:用于实际数据传输的加解密,例如 AES(Advanced Encryption Standard)、RC4 等。
- 数据摘要算法:用于计算哈希,主要是用于验证数据的完整性,防止信息被篡改。
格式:「密钥交换算法 + 签名算法(认证算法) + 对称加密算法 + 摘要算法」。其中密钥交换算法和签名算法可以相同,此时就会合二为一。
比如上图密码套件列表中的第四个 TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA38
密码套件格式构成
在这个例子中:
- ECDHE 表示密钥交换算法是基于椭圆曲线的 Diffie-Hellman(ECDHE)。
- RSA 表示使用 RSA 算法(私钥加密、公钥解密)验证对方身份。
- AES_256_GCM 表示使用 256 位的 AES 加密算法和 GCM 模式。
- SHA384 表示使用 SHA-384 作为消息摘要算法。
不同的密码套件组合提供了不同的安全性和性能特点,服务器和客户端在进行 TLS 握手时会协商选择双方都支持的 Cipher Suite 来建立安全连接。
客户端发送完「Client Hello」(第 72 个报文),第 73 个报文则是服务端向客户端发送的ACK确认消息,代表上面的「Client Hello」已经收到。这里也可以看出服务端是通过普通的 TCP 的 ACK 消息去应答「Client Hello」。
3.2.2. TLS 第二次握手:server -> client (1.Server Hello; 2.Certificate,Server key Exchange,Server Hello Done)
这一次握手时,server 向 client 连续发送了两个报文:
- Server Hello:服务端为了证明自己的身份,会发送「Server Certificate」给客户端,这个消息里含有数字证书;
- Certificate,Server key Exchange,Server Hello Done:目的是告诉客户端,我已经把该给你的东西都给你了,本次打招呼完毕。
3.2.2.1. 服务端发送报文:Server Hello
服务端向客户端发送:
- 服务端支持的协议;
- 使用的 TLS 版本;
- 随机数 Random;
- 服务端选用的密码套件。
Server Hello
上图中可以看到,服务端也生成了一个随机数,并发送给了客户端,服务端生成的随机数记为 Server Random。
小结:
- 到目前为止客户端和服务器都已经拥有了自有的随机数,并且还会把随机数传递给对方,分别记为 Client Random 和 Server Random,那这两个随机数有啥用呢?后文见分晓。
- 客户端和服务端就已确认了 TLS版本和使用的密码套件 TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256。
3.2.2.2. 服务端发送报文:Certificate,Server key Exchange,Server Hello Done
这里服务端在一个数据包中发送了三个 TLS 消息:
- Certificate
- Server key Exchange
- Server Hello Done
3.2.2.2.1. Certificate
可以看到当前数据包中包含了三个数字证书,三个证书实际构成了一个完整的证书链。
最下面的为根证书,最上面的为网站证书。感兴趣的同学可以逐一将证书链中的各个证书字段展开,查看详情。
我们直接在百度网站上点击地址栏中的 " " 图标也能看到此证书链,实际上与我们抓的证书链完全一致。
3.2.2.2.2. Server Key Exchange
之前由于服务端选用 ECDHE 进行密钥协商,所以可以看到「Sever Key Exchange」消息中主要包括密钥交换算法 EC Diffie-Hellman(简称 ECDHE)以及携带的额外数据(Server Params)。Server Params 参数包含:Curve Type、Named Curve 以及 Pubkey,分别代表曲线类型、曲线名称以及椭圆曲线公钥(用于实现密钥交换算法)。为了防止公钥被篡改,这里服务端使用 RSA 私钥对椭圆曲线公钥进行签名并发送给客户端。
实质上这个过程服务器做了三件事情:
- 选择了名为 named_curve 的椭圆曲线,选好了椭圆曲线相当于椭圆曲线基点 G 也定好了,这些都会公开给客户端;
- 生成随机数会作为服务端椭圆曲线的私钥,保留到本地;
- 根据基点 G 和私钥计算出服务端的椭圆曲线公钥,这个会公开给客户端。
以上三件事是 ECDHE 密钥交换必备的步骤,如果前期双方选用了 RSA 密钥交换算法,这里的步骤就又不一样了。
3.2.2.2.3. Server Hello Done
表明 Server Hello 消息结束,这个消息中没有额外的其他字段。
3.2.3. TLS 第三次握手 client -> server (Client Key Exchange, Change Cipher Spec, Encrypted Handshake Message)
该报文中,也是将 TLS 的三个消息合并到一个中发送。
3.2.3.1. Client Key Exchange
客户端收到了服务端的证书及「Server Hello Done」消息后,会先校验证书,校验通过后会将Client Params数据传递给服务端,其中包含自身生成的椭圆曲线公钥(Pubkey),数据内容如图所示:
客户端会生成一个随机数作为客户端椭圆曲线的私钥,然后再根据服务端前面给的信息,生成客户端的椭圆曲线公钥,然后用「Client Key Exchange」消息发给服务端。
至此,双方都有对方的椭圆曲线公钥、自己的椭圆曲线私钥、椭圆曲线基点 G。于是,双方都可计算椭圆曲线的交点(x,y)。
还记得 TLS 握手阶段,客户端和服务端都会生成了一个随机数传递给对方吗?
最终的会话密钥就是用「客户端随机数 + 服务端随机数 + x(ECDHE 算法算出的预共享密钥) 」三者结合生成的。
之所以搞这么麻烦,就是因为 TLS 设计者不信任客户端或服务器伪随机数的可靠性,为了保证真正的完全随机,把三个不可靠家伙混合起来,随机的程度就非常高了,安全性也就更高。
3.2.3.2. Change Cipher Spec
「Change Cipher Spec」消息表示客户端已经生成密钥,并切换到对称加密模式。
3.2.3.3. Encrypted Handshake Message
发送这个消息有两个目的:
- 告诉服务端,客户端在握手的过程中收到和发送的数据做一个摘要并用会话密钥加密发送给服务端做校验,保证 TSL 握手过程中报文没有被修改过;
- 如果服务端收到这个消息并能解密成功,就能说明对称密钥是正确的。
- 「Encrypted Handshake Message」消息其实不只是客户端会发送,之后服务端也会发送一个。
3.2.4. TLS 第四次握手 server -> client (Change Cipher Spec,Encrypted Handshake Message)
服务器也是同样的操作,发送「Change Cipher Spec」和「Encrypted Handshake Message」消息,如果双方都验证加密和解密没问题,那么 TLS 握手正式完成。
最后,就用会话密钥加解密 HTTPS 请求和响应了,即开启了阶段三的加密通信。
问题1:HTTPS 的交互过程中总共用到了几组密钥(包含对称密钥及非对称密钥)?
3.3. 阶段三:加密通信
TLS 握手完成后,客户端与服务端的所有通信内容均被加密,如果没有会话密钥则无法解密通信内容。
问题2:此处的加密通信有可能会被第三方解密吗?如果会,那么第三方运用了什么技术手段?
3.4. 阶段四:TCP 四次挥手断开连接
关于 TCP 四次挥手断开连接的详细过程,上一篇文章已经介绍,这里就不再展开叙述,感兴趣可以参阅结合Wireshark抓包实战,图文详解TCP三次握手及四次挥手原理(附下载) (qq.com)
4. HTTPS 的缺点
尽管 HTTPS 提供了许多安全优势,但也存在一些缺点:
在相同网络环境中,HTTPS 相比 HTTP 无论是响应时间(慢 2~100 倍)还是耗电量(因为需要更多的服务器资源)都有大幅度上升,会导致成本升高。
HTTPS 需要客户端、服务端双方做加解密处理,需要消耗更多 CPU 和内存资源,相比 HTTP 通信,HTTPS 又多了 TLS 握手,会消耗更多的网络资源,总体也导致 HTTPS 响应时间变慢。
HTTPS 并不是绝对安全的,在中间人攻击、服务器劫持等情况下几乎起不到作用。
相比 HTTPS,HTTPS 需要额外购买 SSL 证书,最便宜的证书一年 300 多元,如果是是企业网站证书,一年至少也得 3000 元。
标签:TLS,Server,实验,服务端,HTTPS,3.2,抓包,客户端 From: https://blog.csdn.net/weixin_74531333/article/details/144964752