• 2024-09-15使用python对交换机进行排障自动化运维
    importparamikoimportosimporttimeimportrandomimportdatetimeimportpandasaspdimportreimportnumpyasnp#fromsqlalchemyimporttext,create_engine#importpsycopg2#frompsycopg2importsql#fromsqlalchemy.ormimportsessionmaker#from
  • 2024-08-13从零开始的网络排障-
    一.常用网络排障工具:ping随着ip协议一同诞生的协议虽然基于ip数据包封装协议号为1从报文结构上看属于传输层协议从功能角度看ping常用于测试ip转发是否正常所以icmp常常被作为网络层协议icmp由type和code字段区分数据包类型:当type为0时做响应数据包code为0当type为8
  • 2024-07-27Java热排障|Arthas(阿尔萨斯)Java诊断工具全解析
    文章目录简介为什么使用Arthas优缺点安装Arthas基本命令关键特性与应用场景常见启动异常场景及解决方案使用案例进阶功能结论简介Arthas(阿尔萨斯)是一款由阿里巴巴开源的Java诊断工具,旨在为Java开发者提供一套实时、非侵入性的应用监控和调试方案。它能够在不重启
  • 2024-06-11SRE 排障利器,接口请求超时试试 httpstat
    夜莺资深用户群有人推荐的一个工具,看了一下真挺好的,也推荐给大家。需求场景A服务调用B服务的HTTP接口,发现B服务返回超时,不确定是网络的问题还是B服务的问题,需要排查。工具简介就类似curl,httpstat也可以请求某个后端,而且可以把各个阶段的耗时都展示出来,包括DNS解
  • 2024-04-12SRE 必备利器:域名 DNS 探测排障工具
    问题背景访问某个HTTP域名接口,偶发性超时,原因可能多种多样,比如DNS解析问题、网络质量问题、对端服务负载问题等,在客户端没有良好埋点的情况下,排查起来比较费劲,只能挨个方向尝试,这里送大家一个小工具,可以快速采样DNS解析延迟,快速确认是否是DNS解析问题。使用演示运行工
  • 2024-03-21sqlserver排障手册
    一、内容1.1用于收集日志的诊断工具SQLLogScoutPSSDiagSQLTraceSSPIClientTSSV2SQLDumper1.2用于分析日志的诊断工具SQLNexusAGDiagSQL网络分析器SQLCheckSQLBenchDBTestRML实用工具SQL调用堆栈解析程序1.3 高可用性和灾难恢复(AlwaysOn可用性组)
  • 2024-03-08eNSP 安装教程
    一、安装 a)先安装步骤1依赖组件中的四个组件,其中VBox不要安装在中文目录; b)安装步骤2中的主程序(eNSP1.3.00.100Setup); c)导入步骤3设备包(可选操作)。下载链接:阿里云盘(设备包分享失败,关注加群文件) 二、使用 a)参考eNSP基础操作视频; b)防火墙默认用户名、密
  • 2023-12-07瑞萨RA串口打印排障过程
    在参考立创的教程进行电子时钟制作的时候,前期一直未能有效的实现串口日志输出,这里记录下排障过程。电子时钟制作教程:https://www.bilibili.com/video/BV12z4y1J7nQ/?spm_id_from=333.788&vd_source=516eee863e252e452d8dfe7cb01af5321、硬件阶段:参考教程,完成前期的原理图->PCB->
  • 2023-11-14光纤网络排障分析
    日常工作中,发现某条光链路连接不稳定,时快时慢、时断时连。    在交换机上直接查看这条链路交换口上的光收发功率,发现异常。简单说明下,RXPower代表光模块接收功率,TXPower代表发送功率。引起这种故障的原因很多,一般包含光模块、光纤、交换机端口质量问题,光模块是否选择得当
  • 2023-11-06年底不想背锅!网络工程师必收藏的排障命令大全
    网络故障排除工具是每个网络工程师的必需品。为了提升我们的工作效率,不浪费时间,工具的重要性显而易见特别是每当添加新的设备或网络发生变更时,新的问题就会出现,而且很难快速确定问题出在哪里。每一位网络工程师或从事网相关的人员,都了解几款工具,能让快速定位网络故障。以下是30个常
  • 2023-08-25资深网络工程师的网络排障全过程,太强了!【附工具下载】
    下午好,我的网工朋友我们知道,交换机是局域网中一种很重要的网络设备,它的工作状态与客户端系统的上网状态息息相关。可是,在实际工作过程中,交换机的状态很容易受到外界的干扰,那样一来局域网中就会出现各种各样的网络故障。为了保证网络运行稳定,我们必须在平时对交换机进行妥善管理、维
  • 2023-03-26K8s CrashLoopBackOff 如何排障?
    什么是CrashLoopBackOff CrashLoopBackOff是在k8s中较常见的一种Pod异常状态,最直接的表述,集群中的Pod在不断的重启挂掉,一直循环,往往Pod运行几秒钟因为程序异
  • 2023-02-01开发小白的高光逆袭:竟然能一眼断定生产环境接口响应时间慢是磁盘性能问题引起的
    01问题背景某接口在测试环境耗时600~700ms左右,但在生产环境耗时在1.4s以上,接口实现逻辑包含数据库操作、文件操作、下游微服务调用和其他业务逻辑计算代码,该如何快速排查?团
  • 2023-01-25linux 下网站排障分析常用的命令
    网站排障分析常用的命令系统连接状态篇:1.查看TCP连接状态netstat-nat|awk'{print$6}'|sort|uniq-c|sort-rn netstat-n|awk'/^tcp/{++S[$NF]};END{for(ainS)
  • 2023-01-18生产环境10分钟黄金时间快速排障:CPU不定时飙高怎么排查?
    “ 1分钟发现-5分钟响应-10分钟恢复,是定义故障处理的时效性目标。在阿里巴巴内部经过多年的实践,这也早已成为各个业务稳定性、基础设施稳定性以及大促保障的重要牵引指标。
  • 2023-01-12009排障容器
    一、背景好多业务容器做了裁剪,没法进行基本的调试,所以需要启动一个单独的集成很多排错工具的镜像二、现有方案https://hub.docker.com/r/nicolaka/netshoot(1)k8s
  • 2022-10-31排障最后一公里,“融合”型的日志平台应该如何建设?
    企业建设统一日志平台的需求背景随着业务的发展,IT系统逐渐呈现海量化和异构化的趋势。日志管理与分析在信息记录、操作审计、问题排查等场景中有重要的管理价值。现如今各中
  • 2022-10-17云原生运维排障的关键要点
    随着云原生环境下资源数量暴增、云网快速动态变更、网络传输路径愈发复杂等因素,传统的运维管理模式已经难以应对。云原生网络正呈现出高密度、多层级与频变动的三大特性:高密
  • 2022-10-08Linux操作系统引导过程及排障
    1.Linux操作系统引导过程1.1引导过程图解1.2引导过程详解1.2.1开机自检:bios检测硬件服务器主机开机以后,将根据主板BIOS中的设置对CPU、内存、显卡、键盘等设备进行
  • 2022-09-03现网排障
    1.2022-09-02  PA防火墙故障排除:1.PA防火墙目的NAT策略为outsidetooutside2.PA防火墙的安全策略的目的地址是NAT转换前的公网地址,与思科ASA的安全策略刚好相反