首页 > 系统相关 >Linux 主机意外重启原因

Linux 主机意外重启原因

时间:2022-11-22 14:40:04浏览次数:48  
标签:11 Tue 22 主机 重启 DIMM Linux Nov CPU

查看主机是正常重启还是意外重启:
last -x|head|tac

正常reboot重启显示如下:

root     pts/0        10.5.3.207       Tue Nov 22 11:14 - down   (00:04)    
shutdown system down  3.10.0-1062.el7. Tue Nov 22 11:18 - 11:18  (00:00)    
reboot   system boot  3.10.0-1062.el7. Tue Nov 22 11:18 - 11:39  (00:20)    
runlevel (to lvl 5)   3.10.0-1062.el7. Tue Nov 22 11:18 - 11:23  (00:04)    

正常按电源开关重启显示如下:

root     pts/0        10.5.3.207       Tue Nov 22 11:29 - crash  (00:02)    
reboot   system boot  3.10.0-1062.el7. Tue Nov 22 11:31 - 11:39  (00:08)    
runlevel (to lvl 5)   3.10.0-1062.el7. Tue Nov 22 11:31 - 11:39  (00:08)   

意外重启多数显示如下(非人为或断电,系统自己重启):

reboot   system boot  3.10.0-1160.49.1 Tue Nov 22 02:27 - 13:52  (11:25)    
runlevel (to lvl 5)   3.10.0-1160.49.1 Tue Nov 22 02:27 - 13:52  (11:24)    

那么问题就来了,到底是什么原因引起的重启?
答:80% 是硬件有问题,如电源,内存条,CPU等。
排查原因:
1. 查看message 在重启时间点上下有什么特别的信息   
cat /var/log/message
在重启时间点往前翻,发现有多条报错如下:

Nov 21 17:43:08 host142 kernel: EDAC MC0: 3 CE memory scrubbing error on CPU_SrcID#1_Ha#0_Chan#0_DIMM#0 or CPU_SrcID#1_Ha#0_Chan#0_DIMM#1 (channel:0 page:0x2b980fe offset:0x0 grain:32 syndrome:0x0 -  OVERFLOW area:DRAM err_code:0008:00c0 socket:1 ha:0 channel_mask:1 rank:255)

到这步基本确认是内存有问题了,是Channel#0_DIMM#0: 也就是A1有问题,参照下面的对应表

2. 再进一步查看一下硬件信息
dmesg |grep -Ei 'error|Fail'
如果得到以下信息可能是内存或cpu有问题:

[root@mysql /]# dmesg |grep -Ei 'error|Fail'
[    1.750394] ERST: Error Record Serialization Table (ERST) support is initialized.
[    2.893211] BERT: Boot Error Record Table support is disabled. Enable it by using bert_enable as kernel parameter.
[ 4163.052786] mce: [Hardware Error]: Machine check events logged
[ 4163.052813] EDAC sbridge MC0: HANDLING MCE MEMORY ERROR
[ 4163.352856] EDAC MC0: 2 CE memory scrubbing error on CPU_SrcID#1_Ha#0_Chan#0_DIMM#0 or CPU_SrcID#1_Ha#0_Chan#0_DIMM#1 (channel:0 page:0x2b980fa offset:0x0 grain:32 syndrome:0x0 -  OVERFLOW area:DRAM err_code:0008:00c0 socket:1 ha:0 channel_mask:1 rank:255)

3. 使用工具检查一下内存是否有报错:
yum install -y libsysfs edac-utils
#查看内存是否有报错:
edac-util -v

内存条对应关系如下(DELL R620):
其中 mc0 表示 表示内存控制器0, CPU_Src_ID#0表示源CPU0 , Channel#0 表示通道0
DIMM#0 标示内存槽0,Corrected Errors 代表已经纠错的次数,根据前面列出的CPU通
道和内存槽对应关系即可给edac-utils 返回的信息进行编号。

12条内存的对应关系:
mc0: csrow0: CPU#0Channel#0_DIMM#0: A1
mc0: csrow0: CPU#0Channel#1_DIMM#0: A2
mc0: csrow0: CPU#0Channel#2_DIMM#0: A3
mc0: csrow1: CPU#0Channel#0_DIMM#1: A4
mc0: csrow1: CPU#0Channel#1_DIMM#1: A5
mc0: csrow1: CPU#0Channel#2_DIMM#1: A6
mc1: csrow0: CPU#1Channel#0_DIMM#0: B1
mc1: csrow0: CPU#1Channel#1_DIMM#0: B2
mc1: csrow0: CPU#1Channel#2_DIMM#0: B3
mc1: csrow1: CPU#1Channel#0_DIMM#1: B4
mc1: csrow1: CPU#1Channel#1_DIMM#1: B5
mc1: csrow1: CPU#1Channel#2_DIMM#1: B6

标签:11,Tue,22,主机,重启,DIMM,Linux,Nov,CPU
From: https://www.cnblogs.com/flash100/p/16915007.html

相关文章

  • 虚拟机打不开,提示“此主机不支持虚拟化实际模式”的解决方法。
    文章目录​​1、安装/启动虚拟机失败​​​​2、获取视频教程​​​​3、版权声明​​1、安装/启动虚拟机失败在VMWare软件中,安装/启动虚拟机时,如果出以类似以下的错误提示:......
  • Linux笔记
    Linux操作系统的开机过程:从BIOS开始,然后进入BootLoader,再加载系统内核,然后内核进行初始化,最后启动初始化进程RHEL7采用​​​systemd​​初始化进程服务。checkdate......
  • Linux7系统安装Docker服务
    一.环境准备1.系统介绍系统:centos7.9内核版本:3.10.0-11602.yum更新(不是必须的,后面出现不兼容的情况再update)yum-yupdate#升级所有包同时也升级软件和系统内核;yum-......
  • linux入门
    [Linux就该这么学第二版.pdf](https://www.yuque.com/attachments/yuque/0/2022/pdf/29649025/1658236286875-967f377b-1385-4c5c-af57-fc905c842d5d.pdf)##打包和压......
  • 用C++写一遍linux socket通信过程
    要想深刻理解一些技术的底层,我还是觉得非用用c/c++写一遍的比较好。这其中的原因相信懂的人都懂。回忆一下上学时候在c语言课堂上的激动劲,如今感觉对c的理解真的都是那时候......
  • 一步一图带你深入理解 Linux 物理内存管理
    1.前文回顾在上篇文章《深入理解Linux虚拟内存管理》中,笔者分别从进程用户态和内核态的角度详细深入地为大家介绍了Linux内核如何对进程虚拟内存空间进行布局以及......
  • linux服务器上,如何查看日志和查找问题?
    前言有些高频日志无法输出到数据库,走中间件异步到数据库可能会有延迟。所以,有时候需要将日志直接输出到控制台,混合了大多系统info后,要如何定位呢。姿势cpxxx.logtmpcattm......
  • Linux之挂载新的硬盘
    1.查看磁盘的信息1.1在命令行输入lsblk(记忆:老师不离开的首字母)[root@MYHOST-821~]#lsblk-fNAMEFSTYPELABELUUID......
  • linux screen 常用
    安装 yuminstallscreen常用命令Use:screen[-opts][cmd[args]]or:screen-r[host.tty]Options:-4ResolvehostnamesonlytoIPv4address......
  • 三丰云为学生提供永久免费虚拟主机和云服务器
    首先感谢三丰云提供的免费虚拟主机,免费云服务器,三丰云提供了非常好用的虚拟云空间,和虚拟云服务器(windows/linux),无论是建站还是学习都是很不错了,目前就是应用三丰云提供的免......