记录一次prometheus占用大量内存故障处理

时间：2022-10-04 22:31:20浏览次数：61

近期通过consul注册了100个node_exporter，发现prometheus所在服务器，频繁发生IO负载过高，内存耗尽的问题（4C8G，普通200GHDD盘），导致服务器短暂性失联，直到服务重启后，内存、IO等指标逐渐恢复正常，通过查看官方文档，得知，prometheus默认2小时会将采集的监控指标数据从内存中落到硬盘中，基本可以确定，是内存数据落盘时导致突发性IO增高，由于数据首先写入内存，所以内存也逐渐耗尽，找到问题后，第一个想到的办法是将本地存储改为远端的时序数据库tsdb，降低本地IO，但发现尽管配置了remote_wirte/remote_read，本地还是会落盘，问题没有得到改善，再经过查看配置文件，发现获取节点监控指标的频率是15s，即scrape_interval，而官方默认配置为1m，猜想应该是频率太高，导致内存积累的数据过大，于是将该参数调整为1m，降低了数据采集频率，情况好转，目前内存一直稳定在65-80%，落盘时内存会增大到最高点，数据回写完成后，降到最低点。问题得以解决【在不考虑硬件扩容的情况下】。

标签：1m,占用,落盘,prometheus,内存,IO,数据
From： https://blog.51cto.com/u_11028598/5731980

【云原生】内存数据库如何发挥内存优势
作者：石臻臻,CSDN博客之星Top5、KafkaContributor、nacosContributor、华为云MVP,腾讯云TVP,滴滴Kafka技术专家、LogiKMPMC(改名KnowStream)。LogiKM......
面试官：Redis 过期删除策略和内存淘汰策略有什么区别？
作者：小林coding大家好，我是小林。Redis的「内存淘汰策略」和「过期删除策略」，很多小伙伴容易混淆，这两个机制虽然都是做删除的操作，但是触发的条件和使用的策略都是不同的。......
java的jvm堆中的内存泄露和内存溢出的概念以及区别【杭州多测师】【杭州多测师_王sir
一、什么是内存溢出和内存泄露内存泄漏（memoryleak）：是指程序在申请内存后，无法释放已申请的内存空间，导致系统无法及时回收内存并且分配给其他进程使用。通常少次数的内存无......
【操作系统-内存】页面分配策略和页面置换算法
目录0基本概念1页面分配策略1.1页面分配的策略1.2页面置换的策略1.3分配和置换的策略组合2页面调入策略2.1页面调入的时机2.2页面调入的位置3页面置换算法3.1最......
初学C语言笔记221004动态内存管理
constint*consta=&b;//3intconst*consta=&b;//4第三个a是静态的指针（第二个const修饰)，指向int，这个int是静态的（第一个const修饰）第四个a是静态的......
java----面向对象（1）概念，类与对象的创建，构造器，创建对象和内存分析，以及小总结
面向对象编程1.java的核心思想就是OOP面向过程思想:步骤清晰，第一步做什么，第二步做什么，适合处理一些较为简单的问题2.面向对象思想：分类的斯文模式，思考问题首先会解决问题......
0637-5.16.1-CDH集群中var目录占用空间大问题分析
作者：唐辉1文档编写目的Fayson今天在观察集群的时候，发现CM节点/var目录使用空间异常的大，使用率达到93%,为防止目录空间使用满，导致CM界面告警。于是对该目录进行详细分析测试......
性能测试内存溢出bug的定位和分析【杭州多测师】【杭州多测师_王sir】
1、通过jmeter-n-tcase.jmx在服务器端设置20个并发和持续300秒进行压测2、通过jstat-gcutil进程号命令来监控服务器年轻代、老年代、新生代的垃圾回收情况3、发现......
prometheus+grafana+node-exporter部署监控系统实战
1、在grafana中添加prometheus数据源 2、添加dashboard ......
Linux内存占用过高排查过程
1查看服务器状态系统是CentOSLinuxrelease7.5.1804(Core)使用top命令看了下系统的状态系统的整体负载和cpu并不高，但是内存使用比较高（总8G使用了7.2G）。使用M按内存......

记录一次prometheus占用大量内存故障处理

相关文章

赞助商

阅读排行