• 2024-07-01夜莺国产监控系统
    夜莺(Nightingale)是一个All-in-One的云原生监控工具,集合了Prometheus和Grafana的优点,你可以在UI上管理和配置告警策略,也可以对分布在多个Region的指标、日志、链路追踪数据进行统一的可视化和分析。夜莺融入了顶级互联网公司可观测性最佳实践,沉淀了众多社区专家经验,
  • 2024-06-22华为大数据部分面试题及答案分享
    (1)namenode内存满了,如何进行扩容,调什么参数。1.增加NameNode的内存在hadoop-env.sh文件中,可以增加JVM分配给NameNode的内存。通常是在HADOOP_NAMENODE_OPTS中增加-Xmx参数来增加最大堆内存。exportHADOOP_NAMENODE_OPTS="-Xmx8g-Xms4g${HADOOP_NAMENODE_OPT
  • 2024-06-22【方案】工单系统建设方案(Word原件)
    工单管理系统建设方案1.1系统概述1.1.1需求描述1.1.2需求分析1.1.3重难点分析1.1.4重难点解决措施1.2系统架构设计1.2.1系统架构图1.2.2关键技术1.3系统功能设计1.3.1工单创建1.3.2工单管理1.3.3工单处理1.3.4工单催办1.3.5工单归档1.3.6工单统
  • 2024-06-21Oceanbase数据库500租户告警--模块LobReader使用异常分析
    文档编写这块确是不太好,感觉这篇文章要是写成公众号阅读量得哇哇的,也懒得弄,仅仅记录下信息,并分享下问题的处理思路上午十一点半左右收到告警信息,500租户使用率异常,告警信息如下"【云境平台告警通知】:资源类型:OceanBase集群;资源名称:xxxx;发生时间:2024-06-2111:36:14;告警内容
  • 2024-06-21prometheus 中文说明告警指标
    https://blog.51cto.com/qiangsh/1977449主机和硬件监控可用内存指标主机中可用内存容量不足10%-alert:HostOutOfMemoryexpr:node_memory_MemAvailable_bytes/node_memory_MemTotal_bytes*100<10for:5mlabels:severity:warningannotations:
  • 2024-06-21ThingsBoard实现告警规则创建并生成报警信息
    一、概述1.概念2.告警规则3.简单报警条件步骤1.打开设置配置​步骤2.单击警报规则​步骤3.单击警报条件​步骤4.单击过滤条件步骤5.选择数据键​步骤6.设置条件​步骤7.保存条件步骤8.应用更改4.测试告警 1、使用MQTT发送遥测属性 2、查看告警列表,已存
  • 2024-06-20通过 HIDS 告警分析 webshell 行为
    准备漏洞环境1. 下载 vulhub 仓库gitclonehttps://github.com/vulhub/vulhub.git2.  修改 tomcat 弱口令漏洞环境配置vivulhub/tomcat/tomcat8/tomcat-users.xml将配置文件中的 user 和 password 修改为非弱口令3.  启动漏洞环境(根据实际 docker 环境
  • 2024-06-19筑牢安全生产防线:AI智能分析技术如何赋能企业安全生产管理?
    随着科技的不断进步,人工智能(AI)正逐渐渗透到各个领域,为传统的生产方式带来了革命性的变革。特别是在安全生产领域,AI智能分析技术的应用正日益显示出其强大的潜力和价值。本文旨在探讨AI视频智能分析网关V4的智能分析技术在安全生产中的应用,以及它如何帮助企业提升安全管理水平,实现
  • 2024-06-13AlertManager解析:构建高效告警系统
    本文深入探讨了AlertManager的技术细节和实际应用,从基本概念、核心组件、工作流程,到与Prometheus的集成和实战案例,旨在为专业人士提供一个全面的AlertManager技术和应用指南。关注作者,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、
  • 2024-06-12教你一招,告警恢复时如何拿到恢复时的值?
    Prometheus生态的原生做法,由于阈值是放在promql中的,恢复时的消息中难以拿到恢复时的值,夜莺v7.0.0.beta10版本开始,提供了一种较为简单的内置方式,解决这个问题。下面我们就来看一下如何实现这个能力。升级方法从v6版本开始,程序自动创建表结构,所以v6、v7的各个小版本之间
  • 2024-06-072024安全生产月启动:AI智能监控如何为工厂安全生产保驾护航?
    每年的安全生产月都是全社会共同关注安全生产的重要时刻。在这个特殊的月份里,各行各业都会积极开展安全生产宣传教育活动,旨在提高公众的安全意识,预防和减少生产安全事故的发生。今年6月是第23个全国“安全生产月”,6月16日为全国“安全宣传咨询日”。今年全国“安全生产月”活动主
  • 2024-06-07从缺陷到创新:质量保障的新视角
    1.背景:最近一段时间研发大佬们在积极的治理告警,经过一段时间的治理,现在告警情况已经有了很大的改观,但难免还有漏网之鱼;具体我们可以以下边一个例子来看:这是一个生产的UMP告警,通过这个告警我们发现XXX这个应用的堆内存使用率为90.18%,超过了设置的告警阈值85%,所以产生了这样的
  • 2024-06-07夜莺nightingale的一些k8s指标
    在夜莺nightingale的安装与启动中已经二进制安装了夜莺系统,其web地址为http://<ip>:17000/,默认用户是 root,密码是 root.2020。登录后需要修改密码。使用夜莺系统,主要是使用其告警功能,其告警功能方便易用。本次项目告警设置为:项目通过邮件发送给各项目管理人,系统告警通过企业
  • 2024-06-06zabbix邮箱报警配置
    1.1配置监控的自定义key判断当前机器登录的用户数量,超过3个1.想好,你这个需求,如何用命令采集,构造出结果who|wc-l2.写zabbix-agent的配置文件[root@zabbix-server-71/etc/zabbix/zabbix_agentd.d]#catuserparameter_login_user.confUserParameter=login.user,who|wc-
  • 2024-06-06shell脚本之证书到期监控和企微告警
    shell脚本之证书到期监控和企微告警shell脚本实现ssl证书过期及webhook推送脚本https.sh检测和告警脚本, https://qyapi.weixin.qq.com/cgi-bin/webhook/send?key=xxxxxxxxxxxxx替换为自己企微的webhook地址即可#!/bin/bash#*******************************************
  • 2024-06-06【2024-06-05】贴身感受
    20:00梅子留酸软齿牙,芭蕉分绿与窗纱。日长睡起无情思,闲看儿童捉柳花。                                                 ——《闲居初夏午睡起》杨万里·宋连续两天陪
  • 2024-06-05Grafana监控系统的构建与实践
    本文深入探讨了Grafana的核心技术、数据源集成、仪表盘与可视化构建以及监控与告警配置,旨在为专业从业者提供全面的Grafana技术指南。关注【TechLeadCloud】,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复
  • 2024-06-05数据治理 - [01] 关于数据质量的问题
    题记部分 一、如何保证数据质量问题在数据处理的每一个环节,根据业务要求,提前设置好告警规则。比如,(1)设置日增数据量的阈值以及对于计算结果、某些关键指标的阈值;(2)从数据源获取到数据之后的第一步,就可以根据这个制定的规则,先看数据量是否在阈值范围内,比如正常的情况下,应该
  • 2024-06-05“安全生产月”专题报道:AI智能监控技术如何助力安全生产
    今年6月是第23个全国“安全生产月”,6月16日为全国“安全宣传咨询日”。今年全国“安全生产月”活动主题为“人人讲安全、个个会应急——畅通生命通道”。近日,国务院安委会办公室、应急管理部对开展好2024年全国“安全生产月”活动作出安排部署。随着科技的不断发展,视频智能监控系
  • 2024-06-04alertmanager 对某个标签不告警
    alertmanager对某个标签不告警要在Alertmanager中对某个标签不发送告警,可以使用路由树配置。在路由配置中,你可以指定标签,并为它们设置特定的规则。如果标签匹配特定规则,则不会发送告警。以下是一个Alertmanager的配置示例,它演示了如何对标签severity不等于critical的告
  • 2024-06-03某铁路信息中心运营监测项目
        某铁路信息中心承担大量实时监测、例行巡检和排障维护等工作,为巩固信息化建设成果,提高整体运维效果,保障铁路信息系统稳定运行,需对现有网络监测系统进行升级改造。设备类型:服务器、交换机、数据库、中间件、虚拟机、磁盘阵列、应用软件、操作系统、云平台等。设备品
  • 2024-06-01关于高并发下的数据处理
    架构总是在不断修正演变的过程中得到完善!!!需求背景:接到了一个判断报文中规则来触发告警的需求,本以为需求很简单,具体的告警逻辑就不赘述了,大体的流程是:接收到报文,报文中有定义规则和对应的当前值,判断当前值是否需要触发告警,如果需要则触发告警,存储告警,通过mqtt推送告警信息给前端
  • 2024-05-31四、zabbix7.0推送告警至钉钉webhook机器人
    一、前提条件1、zabbix服务器能够访问钉钉的服务器,具体说是能访问https://oapi.dingtalk.com/robot/send 2、钉钉的webhook是有安全要求的,我采用的是ip的方式,我的zabbix服务器在内网,我的网络出口有多个固定公网ip,所以这样做省事,其他方式也可以你自己考虑。下图是webhook机器
  • 2024-05-30系统稳定性概览
    系统稳定性系统稳定性,包括:监控、告警、性能优化、慢sql、耗时接口等。系统的稳定性的治理,可以围绕这几方面展开。监控Prometheus监控并收集数据。监控qps,rt,cpu,gc次数。。Grafana从数据源(如Prometheus)获取数据并做可视化。告警阿里云告警、webhook推送告警、接口
  • 2024-05-29智能视频监控技术为游泳馆安全护航,助力安全管理新升级
    随着社会的进步和科技的发展,视频监控技术在各行各业的应用越来越广泛。游泳馆作为公共场所,每天都会有大量的游泳者进出。在这样的环境中,有时难免会发生一些意外事故,如溺水、摔倒等。因此,视频监控建设的必要性尤为突出。通过安装视频监控设备及搭建视频监控管理平台,可以实时监控游