首页 > 其他分享 >轻松定位硬件故障方法-日志分析

轻松定位硬件故障方法-日志分析

时间:2023-11-18 10:55:24浏览次数:32  
标签:查看 硬件 故障 内存 日志 告警

同事发现某台机器上message日志数量突然暴增,简单查看了下有内存相关的报错,所以转交给我来查看。

Message日志

进入服务器查看message日志,先看看同事说的告警到底是什么,如下图:
轻松定位硬件故障方法-日志分析轻松定位硬件故障方法-日志分析
还真是,通道3,第一个槽位的内存发生故障了。但是,我只知道A1/B1/A2/B2,所以我还是继续。

Ipmitool工具

不论怎样,Ipmitool工具查看了下,确实是有内存告警,如下图

轻松定位硬件故障方法-日志分析轻松定位硬件故障方法-日志分析

虽然告警,可是无法定位大具体哪根内存坏了呀

IDRAC-web

不论怎样,我们还有DELL自带的IDRAC的web页面可以查看硬件状态,登陆看看,先看看日志,这里有了吧,B6内存槽故障

轻松定位硬件故障方法-日志分析轻松定位硬件故障方法-日志分析

再看看硬件状态,B6内存存在告警

轻松定位硬件故障方法-日志分析轻松定位硬件故障方法-日志分析

就此,我找到了我想要的信息,定位到了B6内存故障,需要更换,至于如何更换,需要注意哪些事项,以后再说。

总结

硬件安全是服务器最底层的安全,一定要做好各项硬件监控,及时处理硬件故障,否则,你们懂的。介绍几种常见的涉及硬件故障分析的日志:

  1. messages日志
  2. dmesg日志
  3. ipmitool sel list查看硬件日志
  4. 远程管理页面上的日志(DELL的IDRAC,HP的ILO,IBM的IMM等等)
  5. smart日志

标签:查看,硬件,故障,内存,日志,告警
From: https://www.cnblogs.com/roccn/p/17840184.html

相关文章

  • c++日志库-log4cplus
    《log4cplus日志库》1.Preface  log4cplus是一款开源的c++日志库,具有线程安全,灵活,以及多粒度控制的特点;log4cplus可以将日志按照优先级进行划分,使其可以面向程序的调试,运行,测试,后期维护等软件全生命周期;可以通过配置,选择将日志输出到屏幕,文件,NTeventlog,甚至是远程服务器......
  • Log4j入门使用(什么是日志? 为什么要使用1og4j)
    @目录......
  • opengl开发:win11已阻止应用程序访问图形硬件如何处理?
     开发中出现这种问题: 请到设置里面搜索:图形设置,浏览,加入exe,选择选项然后设置。不要选择让windows决定即可。 ......
  • 基于 Angular Universal 引擎进行服务器端渲染的前端应用 State Transfer 故障排查案
    笔者之前这篇掘金文章一个SAP开发工程师的2022年终总结:四十不惑提到,我目前的团队,负责开发一款基于Angular框架的电商Storefront应用。这个Storefront是一个开源的、基于Angular和Bootstrap并为SAPCommerceCloud构建的Angular应用程序。图1:SpartacusStore......
  • Red Hat Ceph Storage 故障排除指南
    RedHatCephStorage5故障排除指南-red_hat_ceph_storage-5-troubleshooting_guide-zh-cn.pdfhttps://access.redhat.com/documentation/zh-cn/red_hat_ceph_storage/5/pdf/troubleshooting_guide/red_hat_ceph_storage-5-troubleshooting_guide-zh-cn.pdfRedHatCephSto......
  • SQL Server 查看数据和日志文件占用情况以及所有表的大小、所占空间
    源地址:https://blog.csdn.net/u010741112/article/details/130421018SQLServer基于T-SQL查看所有表大小,所占空间:SELECTt.NAMEASTableName,s.NameASSchemaName,p.rowsASRowCounts,SUM(a.total_pages)*8ASTotalSpaceKB,CAST(ROUND(((SUM(a.total_......
  • Mac 终端命令查看WiFi连接日志【原创】
    写这篇文章的原因是因为经常通过钉钉打上班卡忘记打卡了,我们标准上班时间是上午8:00-10:00,对应下班时间是17:00-19:00 ,有时8:30到公司,就开始忙碌了,作为程序员有时后一忙就忘记时间了,打卡也忘记了,通过钉钉补卡,我如果要步8:30的卡,人事主管不相信,需要提供证据,我想了半天只能看,电......
  • 硬件开发笔记(十二):RK3568底板电路电源模块和RTC模块原理图分析
    前言  做硬件做系统做驱动,很难从核心板做起,所以我们先依赖核心板,分析底板周围的电路,然后使用AD绘制原理图和设计PCB,打样我司测试底板,完成硬件测试,再继续系统适配,驱动移植,从而一步一步完善成为一个功能完善的底板,且搭载了我们跳完的系统和驱动。  本篇文章,先从底板的电源电......
  • 技术实践|高斯集群服务器双缺省网关故障
    ​导语:当前国产化数据库使用范围越来越广泛,在GaussDB数据库的使用过程中难免会遇到一些问题,有的问题是由于在安装过程中没有注意细节而产生的,多数隐患问题都是在特定场景下才会暴露出来,且暴露的时间未知,这就给数据库的运维工作带来极大的挑战。本文就是基于一次数据库安装过程中......
  • 什么是日志分析?为什么IT管理员需要日志分析?
    在现在大数据时代,大量的数据被生成和记录,无论是企业还是个人,都在不断产生各种日志。日志记录了系统、应用程序、网络等多个领域的活动和事件信息,它们对于解决问题、监控和优化系统、还原事件等都非常重要。而这些海量的日志数据中蕴含着丰富的价值,通过日志分析可以发掘出这些隐藏......