首页 > 其他分享 >Elasticsearch分片大小设定和集群容量规划

Elasticsearch分片大小设定和集群容量规划

时间:2024-01-10 10:56:49浏览次数:22  
标签:集群 内存 数据量 分片 文档 磁盘 Elasticsearch GB

本文以 Elasticsearch 7.9.2 为准。

分片大小

日志类:单个分片不超过 50G

搜索类:单个分片不超过 20G

先估算总数据量,再根据分片大小,确定分片数。

容量规划

容量规划时要考虑的因素:

  • 机器的软硬件配置
  • 单个文档的尺寸,文档总数,索引大小,分片个数,副本个数
  • 文档写入方式(如 bulk 的单次数据量)
  • 文档的复杂度
  • 文档的读取方式(如,要进行怎样的查询和聚合)

容量规划的步骤:

  1. 先进行性能评估:例如每秒写多少,每秒读多少,读单个文档能接受多大延迟。
  2. 再观察数据:mapping 的样子,需要什么样的查询和聚合。

两个典型的场景:

  • 搜索:数据增长较慢。
  • 日志:增长快,需要冷热分离,需要自动删除。

硬件配置:

搜索之类的高性能场景,磁盘要 SSD,磁盘 GB 数/内存 GB 数 = 1/10

日志和并发不高的场景,磁盘可以机械硬盘,磁盘 GB 数/内存 GB 数 = 1/50

单节点的数据量最好 2 TB 之内,最大不超过 5 TB。

JVM 的内存配机器内存的一半,同时 JVM 内存不超过 32 GB。

标签:集群,内存,数据量,分片,文档,磁盘,Elasticsearch,GB
From: https://www.cnblogs.com/libin2015/p/17956037

相关文章

  • Mysql数据同步至Elasticsearch
    方案对比鉴于Canal是一个基于MySQL二进制日志的高性能数据同步系统,go-mysql-elasticsearch是一个第三方插件的,虽然都可以同步mysql数据到es,由于es官方文档推荐使用canal工具来同步数据,因此主要将Canal的使用方式提供给用户。核心概念名词解释mysqlbinlogMyS......
  • redis 高可用 二 (主从复制、哨兵和集群Cluster)
    高可用分类主从复制主从复制是高可用Redis的基础,哨兵和集群都是在主从复制基础上实现高可用的。主从复制主要实现了数据的多机备份,以及对于读操作的负载均衡和简单的故障恢复。缺陷:故障恢复无法自动化;写操作无法负载均衡;存储能力受到单机的限制。 哨兵在主从复制的基础......
  • elasticsearch使用笔记
    查询POST/GEThttp://192.168.0.1:9200/waf-20*/_search{"query":{"bool":{"must":[{"match":{"src_ip":"192.168.128.190"}},{"range":{&quo......
  • 《PySpark大数据分析实战》-10.独立集群模式的代码运行
    ......
  • ElasticSearch 性能优化
    提升写入性能使用bulk接口批量写入节省重复创建连接的网络开销通过进行基准测试来找到最佳的批处理数量延长refresh的时间间隔通过延长refresh(刷新)的时间间隔可以降低段合并的频率,段合并十分耗费资源默认的刷新频率为1s,对index修改index.refresh_interval即可立即生效初始......
  • Day1 - 大规模Elasticsearch集群管理心得(转)
    转自:https://elasticsearch.cn/article/110 【携程旅行网吴晓刚】 ElasticSearch目前在互联网公司主要用于两种应用场景,其一是用于构建业务的搜索功能模块且多是垂直领域的搜索,数据量级一般在千万至数十亿这个级别;其二用于大规模数据的实时OLAP,经典的如ELKStack,数据规模可能......
  • Nest 实现大文件分片上传
    文件上传是常见需求,只要指定content-type为multipart/form-data,内容就会以这种格式被传递到服务端:服务端再按照multipart/form-data的格式提取数据,就能拿到其中的文件。但当文件很大的时候,事情就变得不一样了。假设传一个100M的文件需要3分钟,那传一个1G的文件就需要30......
  • linux下使用heartbeat做HA集群,把nginx作为HA对应的服务
    通过安装该Linux-HA软件,可以实现Linux双机系统的高可用性解决方案,实现双机系统的热备份,并能够做到双机之间的无缝切换,从而对外提供稳定可靠的服务,最终实现系统高性能RAS(reliability,availability,andserviceability)。这里使用heartbeat来做HA集群,并且把nginx服务作为HA对应的服......
  • 《PySpark大数据分析实战》-09.Spark独立集群安装
    ......
  • rhel配置ACFS集群文件系统时,asm cluster file systems和volume选项卡为灰色
    问题描述:rhel配置ACFS集群文件系统时,asmclusterfilesystems和volume选项卡为灰色.OS:rhel7.964位数据库:oracle11.2.0.4节点1192.168.133.191rac1节点2192.168.133.192rac21、异常重现在rhel7.964位系统上安装oracle11.2.0.4rac后,发现acfs和advm无法使用,如下ASMC......