首页 > 其他分享 >Easysearch 新特性:写入限流功能介绍

Easysearch 新特性:写入限流功能介绍

时间:2024-07-17 09:19:06浏览次数:13  
标签:throttle Easysearch 写入 write 限流 节点

背景

在 Easysearch 的各种使用场景中,高写入吞吐量的场景占了很大一部分,由此也带来了一些使用上的问题,很多用户由于使用经验不足,对集群的写入压测进行的不够充分,不能很好的规划集群的写入量。

导致经常发生以下问题:

  • 写入吞吐量过大对内存影响巨大,引发节点 OOM,节点掉线问题。
  • 对 CPU 和内存的占用严重影响了其他的查询业务的响应。
  • 以及磁盘 IO 负载增加,挤占集群的网络带宽等问题。

之前就有某金融保险类客户遇到了因业务端写入量突然猛增导致数据节点不停的 Full GC,进而掉入了不停的掉线,上线,又掉线的恶性循环中。当时只能建议用户增加一个类似“挡板”的服务,在数据进入到集群之前进行拦截,对客户端写入进行干预限流:

这样做虽然有效,但是也增加了整个系统的部署复杂性,提高了运维成本。

根据客户的实际场景,Easysearch 从 1.8.0 版本开始引入了节点和 Shard 级别的限流功能,不用依赖第三方就可以限制写入压力,并在 1.8.2 版本增加了索引级别的写入限流。
注意:所有写入限流都是针对各数据节点的 Primary Shard 写入进行限流的,算上副本的话吞吐量要乘以 2。

限流示意图:

下面是限流前后相同数据节点的吞吐量和 CPU 对比:

测试环境:

ip       name   http          port version role master
10.0.0.3 node-3 10.0.0.3:9209 9303 1.8.0   dimr -
10.0.0.3 node-4 10.0.0.3:9210 9304 1.8.0   im   -
10.0.0.3 node-2 10.0.0.3:9208 9302 1.8.0   dimr -
10.0.0.3 node-1 10.0.0.3:9207 9301 1.8.0   dimr *

测试索引配置:

PUT test_0
{
  "settings": {
    "number_of_replicas": 1,
    "number_of_shards": 3
  }
}

压测工具:采用极限科技的 INFINI Loadgen 压测,这款压测工具使用简单,可以方便对任何支持 Rest 接口的库进行压测。

压测命令:

 ./loadgen-linux-amd64 -d 180 -c 10 -config loadgen-easy-1.8.yml

压测 180 秒,10 个并发,每个 bulk 请求 5000 条。

节点级别限流

通过 INFINI Console 监控指标可以看到,限流之前的某个数据节点,CPU 占用 10%,每秒写入 40000 条左右:

在 Cluster Settings 里配置,启用节点级别限流,限制每个节点的每秒最大写入 10000 条,并在默认的 1 秒间隔内进行重试,超过默认间隔后直接拒绝。

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.node.write": true,
    "cluster.throttle.node.write.max_requests": 10000,
    "cluster.throttle.node.write.action": "retry"
  }
}

限流后,CPU 占用降低了约 50%,算上副本一共 20000 条每秒:

Shard 级别限流

设置每个分片最大写入条数为 2000 条每秒

PUT _cluster/settings
{
  "transient": {
    "cluster.throttle.shard.write": true,
    "cluster.throttle.shard.write.max_requests": 2000,
    "cluster.throttle.shard.write.action": "retry"
  }
}

集群级别的监控,同样是只针对主 Shard。

从 Console 的监控指标可以看出,索引 test_0 的 Primary indexing 维持在 6000 左右,正好是 3 个主分片限制的 2000 的写入之和。

再看下数据节点监控,Total Shards 表示主分片和副本分片的写入总和即 4000,单看主分片的话,正好是 2000.

索引级别限流

有时,集群中可能某个索引的写入吞吐过大而影响了其他业务,也可以针对特定的索引配置写入限制。
可以在索引的 Settings 里设置当前索引每秒写入最大条数为 6000:

PUT test_0
{
  "settings": {
    "number_of_replicas": 1,
    "number_of_shards": 3,
    "index.throttle.write.max_requests": 6000,
    "index.throttle.write.action": "retry",
    "index.throttle.write.enable": true
  }
}

下图索引的 Primary indexing 在 6000 左右,表示索引的所有主分片的写入速度限制在了 6000。

总结

通过本次测试对比,可以看出限流的好处:

  1. 有效控制写入压力:
    写入限流功能能够有效限制每个节点和每个 Shard 的写入吞吐量,防止因写入量过大而导致系统资源被过度消耗的问题。

  2. 降低系统资源占用:
    在限流前,某数据节点的 CPU 占用率约为 10%。限流后,CPU 占用率显著降低至约 5%,减少了约 50%。这表明在高并发写入场景下,写入限流功能显著降低了系统的 CPU 负载。

  3. 提高系统稳定性:
    通过控制写入吞吐量,避免了频繁的 Full GC 和节点掉线问题,从而提升了系统的整体稳定性和可靠性。

  4. 保障查询业务性能:
    写入限流功能减少了写入操作对 CPU 和内存的占用,确保其他查询业务的响应性能不受影响。

综上所述,写入限流功能在高并发写入场景下表现出色,不仅有效控制了写入压力,还显著降低了系统资源占用,从而提高了系统的稳定性和查询业务的性能。

关于 Easysearch 有奖征文活动

无论你是 Easysearch 的老用户,还是第一次听说这个名字,只要你对 INFINI Labs 旗下的 Easysearch 产品感兴趣,或者是希望了解 Easysearch,都可以参加这次活动。

详情查看:Easysearch 征文活动

标签:throttle,Easysearch,写入,write,限流,节点
From: https://www.cnblogs.com/infinilabs/p/18306565

相关文章

  • 操作系统真象还原:实现文件写入
    14.7实现文件写入这是一个网站有所有小节的代码实现,同时也包含了Bochs等文件本节要实现的sys_write是系统调用write的内核实现,咱们之前的write是个简易版,它是为了临时完成输出打印的功能,不支持文件描述符。如今要让write支持文件描述符的话,还要修改下周边与此系......
  • qt 单独线程实现日志写入功能
    https://blog.csdn.net/u012329294/article/details/88286961<divid="content_views"class="htmledit_views"><p>在qt开发中,应用程序运行中常常会因为写日志的原因,造成系统性能低下,</p>那么这个时候就应该考虑采用单独的线程来实现日志写入......
  • sqlalchemy pandas转化字典转为orm写入到sqlite数据库报错类型错误的解决办法
    使用pandas读取csv数据,然后将其转化为字典,再写入到数据库的时候,数据库总是报错类型错误,于是转为orm之前,统一转化一下类型fromsqlalchemyimportDECIMAL,Index,String,Date,Integer,Text,CHAR,SmallInteger,Float,Time,case,and_,extract,TypeDecoratorfrom......
  • 突破权限壁垒:彻底解决PyCharm中无法写入的权限问题
    突破权限壁垒:彻底解决PyCharm中无法写入的权限问题引言在使用PyCharm进行开发时,可能会遇到权限不足导致无法写入文件或目录的问题。这种情况通常发生在尝试保存文件到一个没有写权限的目录,或者PyCharm没有足够的权限去修改系统文件时。本文将提供一份详尽的指南,帮助你诊断......
  • echo写入文件多行输入
    在Shell脚本中,你可以使用多种方法来使用echo命令写入多行文本到文件。以下是一些示例:使用echo命令多次写入:bashecho"第一行文本">file.txtecho"第二行文本">>file.txtecho"第三行文本">>file.txt使用echo命令结合>和IFS(内部字段分隔符):bashIFS='\n'echo-e"第一......
  • 5. DRF 限流
    目录DjangoDRF限流1.使用1.1设置认证全局变量1.2为单个视图方法设置权限1.3限制用户一小时只能访问五次DjangoDRF限流1.使用1.1设置认证全局变量在settings.py添加如下代码REST_FRAMEWORK={"DEFAULT_THROTTLE_CLASSES":['utils.throttle.MineThrottle']}......
  • Java Redis多限流
    JavaRedis多限流在Java中实现Redis多限流通常涉及使用Redis的某些特性,如INCR、EXPIRE、Lua脚本或者更高级的Redis数据结构如RedisBitmaps、RedisStreams结合RedisPub/Sub,或者使用Redis的第三方库如RedisRateLimiter(基于Lua脚本或Redis自身功能实现)。然而,为了直接和易于实现......
  • vue 混合方法mixins 协可以写入公共的方法
    新建一个文件夹mixins 同views同级exportdefault{data(){return{};},mounted(){},methods:{//修改标题方法ready(callback){//如果jsbridge已经注入则直接调用if(window.AlipayJSBridge){callback......
  • R语言读取和写入文件
    ####3.2文本文件的读写######3.2.1base包import.txt<-read.table("data/iris.txt",header=TRUE)#读入iris.txt文件head(import.txt)import.csv<-read.table("data/iris.csv",header=TRUE,sep=",")#读入iris.csv文件head(import.c......
  • opencv读取视频文件夹内视频的名字_时长_帧率_分辨率写入excel-cnblog
    看视频的时候有的视频文件名贼长。想要翻看,在文件夹里根本显示不出来,缩短又会丢失一些信息,所以我写了一份Python代码,直接获取视频的名字,时长,帧率,还有分辨率写到excel里。实际效果如下图。可以看到需要的大致信息都被提取出来了接下来直接上代码importosimportxlsxwr......