集群健康和节点可用性
集群状态,green( 所有的主分片和副本分片都正常运行)、yellow(所有的主分片都正常运行,但不是所有的副本分片都正常运行)red(有主分片没能正常运行) elasticsearch_cluster_health_status
集群节点数/数据节点数 elasticsearch_cluster_health_number_of_nodes
活跃的主分片总数 elasticsearch_cluster_health_active_primary_shards
活跃的分片总数(包括复制分片) elasticsearch_cluster_health_active_shards
当前节点正在迁移到其他节点的分片数量,通常为0,集群中有节点新加入或者退出时该值会增加 elasticsearch_cluster_health_relocating_shards
正在初始化的分片 elasticsearch_cluster_health_initializing_shards
未分配的分片数,通常为0,当有节点的副本分片丢失该值会增加 elasticsearch_cluster_health_unassigned_shards
只有主节点能处理集群级元数据的更改(创建索引,更新映射,分配分片等),通过pending-tasks API可以查看队列中等待的任务,绝大部分情况下元数据更改的队列基本上保持为零 elasticsearch_cluster_health_number_of_pending_tasks
主机级别的系统和网络指标
CPU使用率 elasticsearch_process_cpu_percent
磁盘可用空间 elasticsearch_filesystem_data_free_bytes
ES进程打开的文件描述符 elasticsearch_process_open_files_count
ES节点之间网络入流量 elasticsearch_transport_rx_packets_total
ES节点之间网络出流量 elasticsearch_transport_tx_packets_total
JVM内存和垃圾回收
垃圾搜集数 elasticsearch_jvm_gc_collection_seconds_count
垃圾回收时间 elasticsearch_jvm_gc_collection_seconds_sum
最大使用内存限制 elasticsearch_jvm_memory_committed_bytes
内存使用量 elasticsearch_jvm_memory_used_bytes
https://github.com/prometheus-community/elasticsearch_exporter
https://www.cnblogs.com/qianyuliang/p/15410892.html
https://cloud.tencent.com/developer/article/1765046
标签:exporter,采集,shards,cluster,health,分片,elasticsearch,节点
From: https://www.cnblogs.com/o-O-oO/p/18597192