首页 > 系统相关 >[转帖]修改Linux内核参数,减少TCP连接中的TIME-WAIT

[转帖]修改Linux内核参数,减少TCP连接中的TIME-WAIT

时间:2024-01-11 10:36:00浏览次数:37  
标签:tcp 转帖 TCP TIME net ipv4 WAIT

https://www.cnblogs.com/xiaoleiel/p/8340346.html

 

一台服务器CPU和内存资源额定有限的情况下,如何提高服务器的性能是作为系统运维的重要工作。要提高Linux系统下的负载能力,当网站发展起来之后,web连接数过多的问题就会日益明显。在节省成本的情况下,可以考虑修改Linux 的内核TCP/IP参数来部分实现;如果通过修改内核参数也无法解决的负载问题,也只能考虑升级服务器了。

Linux系统下,TCP/IP连接断开后,会以TIME_WAIT状态保留一定的时间,然后才会释放端口。当并发请求过多的时候,就会产生大量的 TIME_WAIT状态的连接,无法及时断开的话,会占用大量的端口资源和服务器资源(因为关闭后进程才会退出)。这个时候我们可以考虑优化TCP/IP 的内核参数,来及时将TIME_WAIT状态的端口清理掉。

本文介绍的方法只对拥有大量TIME_WAIT状态的连接导致系统资源消耗有效,不是这个原因的情况下,效果可能不明显。那么,到哪儿去查TIME_WAIT状态的连接呢?那就是使用netstat命令。我们可以输入一个复核命令,去查看当前TCP/IP连接的状态和对应的个数:
# netstat -an | awk '/^tcp/ {++s[$NF]} END {for(a in s) print a, s[a]}'

这个命令会显示出类似下面的结果:
TIME_WAIT 63648
FIN_WAIT1 3
FIN_WAIT2 4
ESTABLISHED 184
LISTEN 17

我们只用关心TIME_WAIT的个数,在这里可以看到,有6w多个TIME_WAIT,这样就占用了6w多个端口。要知道端口的数量只有65535个,占用一个少一个,会严重的影响到后继的新连接。这种情况下,我们就有必要调整下Linux的TCP/IP内核参数,让系统更快的释放 TIME_WAIT连接。

我们用vim打开配置文件:
# vim /etc/sysctl.conf

然后,在这个文件中,加入下面的几行内容:
    net.ipv4.tcp_syncookies = 1
    net.ipv4.tcp_tw_reuse = 1
    net.ipv4.tcp_tw_recycle = 1
    net.ipv4.tcp_fin_timeout = 5

最后输入下面的命令,让内核参数生效:
# /sbin/sysctl -p

简单的说明下,上面的参数的含义:
net.ipv4.tcp_syncookies = 1 表示开启SYN Cookies。当出现SYN等待队列溢出时,启用cookies来处理,可防范少量SYN攻击,默认为0,表示关闭;

net.ipv4.tcp_tw_reuse = 1 表示开启重用。允许将TIME-WAIT sockets重新用于新的TCP连接,默认为0,表示关闭;

net.ipv4.tcp_tw_recycle = 1 表示开启TCP连接中TIME-WAIT sockets的快速回收,默认为0,表示关闭;

net.ipv4.tcp_fin_timeout 修改系统默认的 TIMEOUT 时间。

在经过这样的调整之后,除了会进一步提升服务器的负载能力之外,还能够防御一定程度的DDoS、CC和SYN攻击,是个一举两得的做法。

此外,如果你的连接数本身就很多,我们可以再优化一下TCP/IP的可使用端口范围,进一步提升服务器的并发能力。依然是往上面的参数文件中,加入下面这些配置:
    net.ipv4.tcp_keepalive_time = 1200
    net.ipv4.ip_local_port_range = 10000 65000
    net.ipv4.tcp_max_syn_backlog = 8192
    net.ipv4.tcp_max_tw_buckets = 5000

这几个参数,建议只在流量非常大的服务器上开启,会有显著的效果。一般的流量小的服务器上,没有必要去设置这几个参数。这几个参数的含义如下:

net.ipv4.tcp_keepalive_time = 1200 表示当keepalive起用的时候,TCP发送keepalive消息的频度。缺省是2小时,改为20分钟。

net.ipv4.ip_local_port_range = 10000 65000 表示用于向外连接的端口范围。缺省情况下很小:32768到61000,改为10000到65000。(注意:这里不要将最低值设的太低,否则可能会占用掉正常的端口!)
net.ipv4.tcp_max_syn_backlog = 8192 表示SYN队列的长度,默认为1024,加大队列长度为8192,可以容纳更多等待连接的网络连接数。

net.ipv4.tcp_max_tw_buckets = 5000 表示系统同时保持TIME_WAIT的最大数量,如果超过这个数字,TIME_WAIT将立刻被清除并打印警告信息。默认为180000,改为5000。对于Apache、Nginx等服务器,上几行的参数可以很好地减少TIME_WAIT套接字数量,但是对于 Squid,效果却不大。此项参数可以控制TIME_WAIT的最大数量,避免Squid服务器被大量的TIME_WAIT拖死。

经过这样的配置之后,你的服务器的TCP/IP并发能力又会上一个新台阶。在存在大量短连接的情况下,Linux的TCP栈一般都会生成大量的 TIME_WAIT 状态的socket。
# netstat -ant|grep -i time_wait |wc -l

可能会超过三四万。这个时候,我们需要修改 linux kernel 的 tcp time wait的时间,有个 sysctl 参数貌似可以使用,它是 /proc/sys/net/ipv4/tcp_fin_timeout,缺省值是 60,也就是60秒,很多网上的资料都说将这个数值设置低一些就可以减少netstat 里面的TIME_WAIT状态,但是这个说法不是很准确的。经过认真阅读Linux的内核源代码,我们发现这个数值其实是输出用的,修改之后并没有真正的读回内核中进行使用,而内核中真正管用的是一个宏定义,在 $KERNEL/include/net/tcp.h里面,有下面的行:
      #define TCP_TIMEWAIT_LEN (60*HZ)
      而这个宏是真正控制 TCP TIME_WAIT 状态的超时时间的。如果我们希望减少 TIME_WAIT 状态的数目(从而节省一点点内核操作时间),那么可以把这个数值设置低一些,根据我们的测试,设置为 10 秒比较合适,也就是把上面的修改为:
      #define TCP_TIMEWAIT_LEN (10*HZ)

  然后重新编译内核,重启系统即可发现短连接造成的TIME_WAIT状态大大减少:
  netstat -ant | grep -i time_wait |wc -l
  一般情况都可以至少减少2/3。也能相应提高系统应对短连接的速度

标签:tcp,转帖,TCP,TIME,net,ipv4,WAIT
From: https://www.cnblogs.com/jinanxiaolaohu/p/17958001

相关文章

  • 加载动态库onnxruntime
    publicstaticIntPtrOnnxRuntimeImportResolver(stringlibraryName,Assemblyassembly,DllImportSearchPath?searchPath){//调试信息LogHelper.NlogTrace(libraryName);if(libraryName!="onnxruntime")......
  • java.lang.RuntimeException: setParameters failed 解读
    解决java.lang.RuntimeException:setParametersfailed错误在Java开发中,当我们使用相机(Camera)功能进行拍照或录像时,有时可能会遇到java.lang.RuntimeException:setParametersfailed这样的错误。这个错误通常表示相机参数设置失败,导致无法进行预期的相机操作。本篇文章将介绍可......
  • 使用tcpdump抓取网络包,在wareshark查看对应请求及响应的最终报文
    tcpdump是Linux环境的抓包工具,可以使用此工具抓取指定host的所有网络包,在wareshark工具中进行查看。tcpdumphost  [IP或域名]   -w [文件名]示例如下:1、执行命令,抓取server端对webxml.com.cn站点的网络报文;2、在server端执行对webxml的SOAP请求;3、ctrl+c 终止抓取;4......
  • Flink的waterMark概念解释 watermark是flink为了处理event time窗口计算提出的一种机
    Flink的waterMark概念解释watermark是flink为了处理eventtime窗口计算提出的一种机制,本质上就是一个时间戳,代表着比这个时间早的事件已经全部进入到相应的窗口,后续不会在有比这个时间小的事件出现,(触发)基于这个前提我们才有可能将eventtime窗口视为完整并触发窗口的计算。St......
  • java8日期时间格式化DateTimeFormatter多个格式
    原文地址:datetimeformatter.ofpatternmultipleformats-掘金DateTimeFormatter 是一个用于日期时间格式化和解析的类。使用 ofPattern 方法可以创建一个格式化器,该方法接受一个日期时间格式的字符串作为参数。如果您需要在同一个 DateTimeFormatter 对象中支持多种不同的......
  • datetime毫秒python
    实现datetime毫秒Python引言在Python中,datetime模块提供了处理日期和时间的功能。然而,datetime模块默认只提供精确到秒的时间戳,如果需要精确到毫秒的时间戳,我们需要对datetime模块进行一些扩展。本文将指导你如何实现在Python中获取精确到毫秒的时间。流程概述下面是实现dat......
  • 高并发下 MySQL Statement Cancellation Timer 的线程数暴涨
    微信公众号:运维开发故事作者:老郑问题描述线上业务高峰期CPU飙升,抓取threaddump发现 MySQLStatementCancellationTimer 的线程数比较多,接收到线上预警,分析一下原因。业务高峰:下面是一些可能相关的信息( mysql驱动,db连接池,orm框架)依赖信息:mysql-jdbc8.0.24druid1.2.8m......
  • pytorch反向传播错误解决:RuntimeError: Trying to backward through the graph a seco
    pytorch反向传播错误解决:错误:RuntimeError:Tryingtobackwardthroughthegraphasecondtime,butthebuffershavealreadybeenfreed.Specifyretain_graph=Truewhencallingbackwardthefirsttime.归因排查:出现这种错误有可能是反向传播过程中出现了二次传播,......
  • MySQL三大日志,mvcc、DateTime 类型等
    1、MySQL事务隔离级别详解解决幻读的方法解决幻读的方式有很多,但是它们的核心思想就是一个事务在操作某张表数据的时候,另外一个事务不允许新增或者删除这张表中的数据了。解决幻读的方式主要有以下几种:将事务隔离级别调整为 SERIALIZABLE 。在可重复读的事务级别下,给事务操......
  • [转帖]Linux中的lstopo命令(详细指南)
    https://juejin.cn/post/7117544110856077343 目录:简介语法命令总结参考文献介绍lstopo命令是用来显示系统的拓扑结构的。它提供了关于NUMA内存节点、共享缓存、CPU包、处理器内核和线程等信息。语法它渲染由hwloc发现的机器拓扑结构,有两种主要模式:文本渲染或图......