HTTP是什么
一、HTTP是什么
- HTTP全称为Hyper Text Transfer Protocol,被译为超文本传输协议,是互联网上应用最为广泛的—种网络协议。
- **HTTP协议是在Web上进行数据交换的基础,是一种“客户端-服务器端”协议。**也就是说,请求通常是由像刘览器这样的接受方发起的。一个完整的Web文档通常是由不同的子文档拼接而成的,像是文本、布局描述、图片、视频、脚本等等。
- 设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
二、HTTP协议历史与标准
- HTTP/O.9: 1991年制定,有严重设计缺陷,只支持GET方法,不支持MIIME类型,很快被
HTTP/1.0取代。 - HTTP/1.0: 1996年制定,支持多种请求方法,支持多媒仲对象,得到广泛应用。
- HTTP/10+:支持持久连接、虚拟主机、代理连接等新特性,成为非官方的事实标准。
- HTTP/11: 1999年制定,校正HTTP中的设计缺陷,性能优化,删除一些不好的特性。
- HTTP-NG(或HTTP/20):关注HTTP协议的性能优化以及更强大的服务逻辑远程执行框架,研究工作仍在进行中。
三、HTTP请求与响应消息
客户端和服务端通过交换各自的消息(与数据流正好相反)进行交互。
-
由像浏览器这样的客户端发出的消息叫做****请求( requests )
-
被服务端回应的消息叫做****响应(responses )
四、HTTP基本原理
-
HTTP被设计于上20世纪90年代初期,是一种可扩展的协议。
-
**HTTP是应用层的协议,**通过TCP,或者是TLS-加密的TCP连接来发送,理论上任何可靠的传输协议都可以使用。
-
因为其良好的扩展性,时至今日,它不仅被用来传输超文本文档,还用来传输图片、视频或者向服务器发送如HTML表单这样的信息。
-
HTTP还可以根据网页需求,仅获取部分Web文档内容更新网页。
-
五、HTTP的基本特性
- HTTP是简单的
虽然下一代HTTP/2协议将HTTP消息封装到了帧中,HTTP大体上还是被设计得简单易读。
HTTP报文能够被人读懂,还允许简单测试,降低了门槛。 - HTTP是可扩展的
在HTTP/1.O中出现的HTTP headers让协议扩展变得非常容易。 - HTTP是无状态,有会话的
在同一个连接中,两个执行成功的请求之间是没有关系的。这就带来了一个问题,用户没有办法在
同一个网站中进行连续的交互。 - HTTP和连接
一个连接是由传输层来控制的,这从根本上不属于HTTP的范围。
六、HTTP能控制什么
以下是可以被HTTP控制的常见特性:
- 缓存
- 开放同原限制
- 认证
基本的认证功能可以直接通过HTTP提供,或用HTTP Cookies来设置指定的会话。 - 代理和隧道
通常情况下,服务器和/或客户端是处于内网的,对外网隐藏真实IP地址。因此HTTP请求就要通
过代理越过这个网络屏障。 - 会话
七、HTTP流(固定方向流动数据)
-
打开一个TCP连接:TCP连接被用来发送一条或多条请求,以及接受回应消息。
-
发送一个HTTP报文:HTTP报文(在HTTP/2之前)是语义可读的。
GET/HTTP/1.1 Host: dexeloper.mozilla.org. Accept-Language: fr
- 1
- 2
- 3
-
读取服务端返回的报文信息:
HTTP/1.1 200 OK Last-Modified: Tue,o1 Dec 2009 20:18:22 GMT Content-Length: 29769 Content-Type: text/html
- 1
- 2
- 3
- 4
-
关闭连接或者为后续请求重用连接。
八、概述
-
请求通过一个实体被发出,实体也就是用户代理。大多数情况下,这个用户代理都是指浏览器。
-
每一个发送到服务器的请求,都会被服务器处理并返回一个消息,也就是响应。
-
在这个请求与回应之间,还有许许多多的被称为Proxies的实体,他们的作用与表现各不相同。
九、客户端
- user-agent就是任何能够为用户发起行为的工具。这个角色通常都是由刘览器来扮演。一些例外情况,比如是工程师使用的程序,以及Web开发人员调试应用程序。
- 浏览器总是作为发起一个请求的实体(近几年已经出现一些机制能够模拟由服务器发起的请求消息,例如Nodejs )。
- 浏览器首先发送一个请求来获取页面的HTML文档,再解析文档中的资源信息发送其他请求,获取可执行脚本或CSS样式来进行页面布局渲染,以及一些其它页面资源(如图片和视频等)。然后,刘览
器将这些资原整合到一起,展现出一个完整的文档,也就是网页。
十、Web服务器
在HTTP协议通信过程的另一端,是由Web服务器来服务并提供客户端所请求的文档。服务器只是虚拟意义上代表一个机器:它可以是共享负载(负载均衡)的一组服务器组成的计算机集群,也可以是一种复杂的软件,通过向其他计算机(如缓存,数据库服务器,电子商务服务器等)发起请求来获取部分或全部资源。
Web服务不一定是一台机器,但一个机器上可以装载的众多Web服务。
十一、代理(Proxies)
在刘览器和服务器之间,有许多计算机和其他设备转发了HTTP消息。
由于Web栈层次结构的原因,它们大多都出现在传输层、网络层和物理层上,对于HTTP应用层而言就是透明的,虽然它们可能会对应用层性能有重要影响。还有一部分是表现在应用层上的,被称为代理(Proxies)。
代理(Proxies)既可以表现得透明,又可以不透明(“改变请求”会通过它们)。
代理主要有如下几种作用:
- 缓存(可以是公开的也可以是私有的,像浏览器的缓存)
- 过滤(像反病毒扫描,家长控制)心
- 负载均衡(让多个服务器服务不同的请求)
- 认证(对不同资原进行权限管理)
以不透明(“改变请求”会通过它们)。
代理主要有如下几种作用:
- 缓存(可以是公开的也可以是私有的,像浏览器的缓存)
- 过滤(像反病毒扫描,家长控制)心
- 负载均衡(让多个服务器服务不同的请求)
- 认证(对不同资原进行权限管理)
- 日志记录(允许存储历史信息)