首页 > 其他分享 >【读书笔记-《网络是怎样连接的》- 2】Chapter2_1-协议栈通信详细过程

【读书笔记-《网络是怎样连接的》- 2】Chapter2_1-协议栈通信详细过程

时间:2024-10-24 18:50:19浏览次数:9  
标签:协议 服务器端 读书笔记 TCP Chapter2 信息 接字 连接 客户端

第二章从协议栈这部分来看网络中的通信如何实现,准备从两部分来进行分解。本篇是第一部分:详细介绍TCP协议栈收发数据的过程。

在这里插入图片描述
首先来看下面的图。从应用程序到网卡需要经过如下几部分,上面的部分通过委托下面的部分来完成工作。首先是应用程序,通过Socket库来委托协议栈完成工作。Socket库中包含解析器,可以通过向DNS发送信息获取IP地址,这在第一篇【读书笔记-《网络是怎样连接的》- 1】Chapter1-从Web浏览器开始中已经做了介绍。

接下来进入协议栈。协议栈的上半部分分两种:TCP协议与UDP协议。TCP协议与UDP协议会在后面详细介绍,这里只需要先记住浏览器、邮件等一般应用程序收发数据时用TCP,DNS查询等收发较短的控制数据时用UDP就可以了。

下半部分是IP协议控制网络包收发操作的部分。在互联网上传送数据时,数据会被切分成多个网络包,IP协议就负责将网络包发送给通信对象。此外IP中还包括ICMP协议与ARP协议。ICMP用于告知网络包传送过程中产生的错误以及各种控制消息,ARP用于根据IP地址查询相应的以太网MAC地址。

再下面就是网卡驱动程序,控制下一层的网卡完成数据的收发操作。

本篇我们就来看协议栈的上半部分中TCP协议完成数据收发操作的过程。

在这里插入图片描述

1. 创建套接字

我们已经知道套接字在收发数据中发挥着关键作用,那么套接字具体是什么?

其实套接字没有实体。协议栈在创建套接字时会分配一块内存,其中存放了通信控制信息,这块内存空间就可以被称为套接字。协议栈在执行操作时要参照这些控制信息。这些控制信息包含什么呢?例如,在发送数据时,需要查看套接字中通信对象的IP地址与端口号。发送数据之后,协议栈会等待对方的响应信息。网络中的数据可能丢失。如果一直等不到响应信息,则需要在等待一定时间之后重新发送,这就需要在套接字中记录是否收到响应信息,以及发送数据后经过的时间等等。

从以上的例子可以看出,协议栈是根据套接字中的控制信息来工作的

我们来看看实际的套接字。在Windows系统下运行netstat -ano命令,可以查看到如下信息:
在这里插入图片描述展示的每一行信息表示一个套接字。

创建套接字主要有两个步骤。首先协议栈分配一块内存空间,并写入如上初始的控制信息;接下来还需要将套接字的描述符告知应用程序。这样后续应用程序在使用套接字时只需要提供这个描述符即可。通过描述符,协议栈可以定位套接字,并获取所有的相关信息。

2. 建立连接

套接字创建完毕,接下来需要建立连接。

2.1 建立连接的目的

服务器和客户端能实现通信,物理上的网线肯定是连接好的,不需要每次访问都进行插拔网线的操作。那么这里的建立连接是指什么呢?

简而言之,这里建立连接的过程是通信双方交换控制信息,在套接字中记录这些信息并准备收发数据的一系列操作。

套接字刚刚创建完成时,套接字中没有通信对象的信息。在客户端一侧,协议栈不知道应该将信息发给谁。虽然应用程序知道通信对象的信息,如Web客户端知道要通信的服务器IP与端口号,但是在创建套接字的时候,这些信息并没有传递给协议栈,因此建立连接的目的之一就是将这些信息通知协议栈,协议栈将这些信息保存在套接字中。

而在服务器一侧,是创建好了套接字等待客户端一侧的连接。在连接建立之前,服务器端的应用程序和协议栈都不知道客户端通信对象的信息。因此建立连接的第二个目的是客户端向服务器传达开始通信的请求,传送自己的控制信息。

此外,还需要分配一块内存空间用于临时存放收发的数据,称为缓冲区。

2.2 控制信息

以上就是建立连接的目的。所说的控制信息具体包含哪些内容呢?

***控制信息可以分为两类。一类是客户端和服务器端相互通信需要交换的控制信息。***这类信息不仅在建立连接是需要,在后续收发数据以及断开连接的过程中也需要。这些内容在TCP协议的规格中进行了定义,如下表所示。这些字段是固定的,在每次客户端与服务器端进行通信时都需要提供,会被添加在二者之间传递的网络包的开头。由于位于网络包的开头,因此被称为头部。以太网协议与IP协议等也有自己的控制信息,也被称为头部,因此有以太网头部(MAC头部),IP头部,TCP头部等。
在这里插入图片描述
***另一类是保存在套接字中的控制信息。***这些控制信息与协议栈的实现有关,如在Windows系统和Linux系统中,协议栈的实现不同,套接字中保存的控制信息就有所不同。但只要根据协议将正确的信息写入了头部,就可以进行正常通信。

2.3 建立连接的实际过程

下面来看连接的实际过程。应用程序调用Socket库中的connect函数,调用connect函数时会传送套接字的描述符与服务器的IP地址、端口号,这些信息会传送给协议栈中的TCP模块。接下来TCP模块会与该IP地址对应的对象,即服务器端的TCP模块进行信息交换,这一过程包括以下几个步骤:

  1. 客户端创建一个包含表示开始数据收发操作的控制信息的头部,如上表所示。字段很多,主要关注发送方与接收方的端口号。这样客户端套接字就准确找到了服务器端的套接字,然后将头部信息中控制位的SYN比特设置为1,当前可以先理解为表示连接。此外还需要设置序号和窗口大小,会在稍后详细讲解。客户端TCP模块接下来委托IP模块将信息发送给服务器端。

  2. 在服务器端IP模块接收到信息之后,再传送给服务器端的TCP模块,服务器端的TCP模块会根据端口号找到对应的套接字,也就是在状态为等待连接的套接字中找到与接收信息中端口号一致的套接字。找到之后,这一套接字的状态会被修改为正在连接。完成后,服务器端的TCP模块会返回响应。与客户端操作一样,需要在TCP头部中设置发送发与接收方的端口号以及SYN比特。此外,还需要设置ACK比特。ACK比特用于互相确认信息是否送达,稍后也会进行详细介绍。

  3. 服务器端的信息返回到客户端,客户端通过TCP头部信息确认连接是否成功。如果SYN比特为1,则表示连接成功,此时会向套接字中写入服务器的IP地址与端口号,并将套接字的状态修改为连接完毕。最后,对于服务器端发来的信息,客户端也需要将ACK比特设置为1并返回服务器。服务器收到响应之后,连接操作才算全部完成了。

3. 收发数据

3.1 平衡发送时间与发送数据量

到此为止,连接建立,接下来就可以进行收发数据的操作了。

对于协议栈来说,应用程序委托其发送的数据只是二进制序列而已,并不关心其具体内容。而且协议栈并不会一收到数据就马上发送出去。如果协议栈一收到数据就马上发送出去,可能会发送大量的小包,导致网络的效率下降。一般会先存放在缓冲区中,积累到一定量时再发送出去。至于积累的量,不同的操作系统也会有所不同,主要考虑的要素有以下两个。

***首先是每个网络包所能容纳的数据长度。***MTU表示一个网络包的最大长度,在以太网中一般是1500字节,其中包含了头部。因此MTU减去头部的长度,得到的就是一个网络包所能容纳的最大数据长度MSS。当数据积累到接近或超出MSS时再进行发送,就可以避免发送大量小包的问题了。

第二个要素是时间。当应用程序发送数据的频率比较低的时候,如果每次都积累到MSS再发送,可能会因为等待时间过长而导致延迟。因此协议栈中有一个计时器,经过一定时间后也会将网络包发送出去。

这两个要素其实是互相矛盾的。如果长度有限,则网络效率得到提高,但可能因为等待填满缓冲区而产生延迟;相反如果时间优先,则延迟时间会变少,但网络效率又降低了。所以在实际发送过程中需要综合考虑这两个要素以达到平衡,因此不同的操作系统在实现上就存在一定的差异。

此外协议栈也给应用程序保留了控制发送的时机。像浏览器这种会话型的应用程序在向服务器发送数据时,延迟会产生很大影响,因此一般会使用直接发送的选项。

对于一次发送大量数据的情况下,缓冲区中的数据远远超出MSS的长度,这时候就需要将缓冲区中的数据以MSS为单位拆分成许多块,每一块加上TCP头部后就可以委托给IP模块进行发送了。

3.2 序号与ACK号

TCP协议的一项重要功能就是确认对方是否成功收到网络包。因此发送网络包之后,还需要进行确认操作。

首先,TCP模块在拆分数据时,会计算处每一块数据相当于从头开始的第几个字节,在发送时会将这个字节数写在TCP头部中,这就是“序号”字段。此外对方还可以通过网络包的长度减去头部的长度,计算得到发送数据的长度。

通过序号和长度,对方可以确认接收的数据有没有遗漏。如果上次接收到第1460字节,下一次接收从1461字节开始的包,则说明中间没有遗漏。如果确认没有遗漏,接收方会将到目前为止接收到的数据长度加起来,计算一共收到了多少字节,将这个字节数写入到TCP头部的ACK号来返回给发送方。这样发送方就可以确认接收方一共收到了多少数据。

原理如此,实际操作过程中还有些变化。由于序号从1开始很容易被预测和攻击,因此序号的初始值是一个随机数,发送方需要在数据收发开始之前将这个初始值告知通信对象。在连接过程中将SYN比特设置为1就是为了实现这一步骤的。在将SYN比特设置为1的同时,会将序号字段设置为初始值。

前面只考虑了单向的传输,反之亦然。客户端需要计算序号发送给服务器端,服务器端收到后会回复ACK号给客户端;服务器端也需要计算出一个序号发送给客户端,客户端收到后同样会回复ACK号给服务器端。如下图所示。TCP采用这样的方法确认对方是否收到了数据,在得到对方确认之前,发送过的包都会保存在发送缓冲区中。如果对方没有返回某些包对应的ACK号,那么就重新发送这些包。因为有了这一机制,在网络的其他部分也不需要对错误进行补救了。在网卡、集线器、路由器等部分,一旦检测到错误就直接丢弃相应的包。

当然,如果出现了服务器宕机等情况,无论重试多少次都不会收到响应,TCP在重试几次后会强制结束通信,并向应用程序报错。

在这里插入图片描述

标签:协议,服务器端,读书笔记,TCP,Chapter2,信息,接字,连接,客户端
From: https://blog.csdn.net/Ocean1994/article/details/143033044

相关文章

  • 节省你的SSH连接时间:ControlMaster 使用指南
    背景最近有需求在远程服务器上频繁传输文件(scp),然后执行一些命令。但是这个远程服务器延迟比较高,而且认证花费的时间比较长,让人非常不耐烦。然后发现了一个可以加快这个步骤的工具:ControlMaster。来源:StackExchangeHackerNews简介ControlMaster是OpenSSH提供的一个功......
  • 内连接、左连接、右连接图示及语法
    一、内连接同时将两表作为参考对象,根据ON(或WHERE)后给出的两表的条件将两表连接起来。结果是满足连接条件的交集即A∩B={x∣x∈A∧x∈B}显式内连接(使用JOIN...ON关键字)SELECTcolumnsFROMtable1JOINtable2ONtable1.column_name=table2.column_......
  • 数据库连接技术JDBC—(完整详解,包括JDBC的API,附有案例+代码)
    文章目录一.JDBC初始1.1概述1.2JDBC本质1.3使用JDBC步骤二.JDBCAPI详解2.1DriverManager2.2Connection2.2.1获取执行对象2.2.2事务管理2.3Statement2.4ResultSetResultSet使用练习2.5PreparedStatement2.5.1PreparedStatement用处2.5.2PreparedStatement......
  • Python连接MySQL
    要使用Python连接MySQL并操作数据,通常会使用pymysql或mysql-connector-python这样的库。使用pymysql库来连接MySQL、读取表并按照某个关系将它们连接起来。1、安装必要的库:pipinstallpymysqlpandas2、连接MySQL并读取数据:importpymysqlimportpandasaspd#MySQL......
  • 《程序员修炼之道:从小工到专家》读书笔记3
    程序员的流派程序员同样可以被视为属于某种“流派”,不同的流派对应着不同的技能、哲学和最佳实践。每个程序员都应该认识到自己的流派,这有助于他们选择合适的工具和方法来解决问题。关注质量而非数量编写高质量的代码比单纯注重代码的数量要重要得多。质量高的代码更容易维......
  • 24-10-21-读书笔记(二十八)-《契诃夫文集》(十二)下([俄] 契诃夫 [译] 汝龙)我们会生活下去!
    文章目录《契诃夫文集》(十二)下([俄]契诃夫[译]汝龙)我们会生活下去!阅读笔记读后感总结《契诃夫文集》(十二)下([俄]契诃夫[译]汝龙)我们会生活下去!  这篇就是《海鸥》、《三姐妹》和《樱桃园》。阅读笔记海鸥P139陀尔恩还有一点。作品里必须有清楚明白的思......
  • 结合ellisys空口分析扩展广播BLE连接配对
    背景BT5.0开始引入BLE扩展广播,单个广播可以携带更多的字节数(从legacy的31个字节扩大到251个字节),同时广播的信道也不再拘泥于原来的37,38,39信道,引入辅助信道概念(0-36信道均可),为BLEAUDIO的应用打下了坚实的基础,下面结合手机和耳机的ellisys空口包,来分析BLEAUDIOCIS扩展广......
  • 操作指南|远程连接linux或windows系统的服务器跑深度学习项目
    目录远程连接linux系统服务器软件清单list使用winscp传输文件操作指南使用pycharmpro连接远程服务器运行项目1、下载并打开pycharmpro2、配置环境3、配置环境完成后,选择python解释器4、运行文件5、查看GPU使用情况远程连接windows系统服务器使用winscp传输文件远程连接服务器远......
  • 深入理解Linux内核网络(五):TCP连接的建立过程
    本文将深入探讨TCP协议中的listen和connect系统调用及其相关机制,并对TCP连接建立的完整过程进行详细分析,同时讨论异常情况及其处理方法。部分内容来源于《深入理解Linux网络》、《Linux内核源码分析TCP实现》listen原理系统调用概述listen用于将一个主动套接字(主......
  • 【磐维数据库】业务无法连接-连接数限制
    连接数介绍江西移动现场应用侧在使用磐维数据库,做应用兼容改造时,发现程序连接报错,借此介绍下磐维数据库在连接限制上的主要手段。方法分三层:实例级别、数据库级别和用户级别。max_connections(全局连接数限制)参数说明:允许和数据库连接的最大并发连接数。此参数会影响Vastbase......