首页 > 其他分享 >Exadata中的Infiniband交换机,更换完SSD模块后,交换机反复重启

Exadata中的Infiniband交换机,更换完SSD模块后,交换机反复重启

时间:2024-09-25 21:14:13浏览次数:1  
标签:Infiniband 重启 交换机 模块 SSD 日志

1. 故障描述

客户的Exadata X5-2,  某天收到EM13c告警,提示Exadata中的Infiniband交换机出现故障。

 

2. 故障处理

2.1  执行showunhealthy命令后,显示告警信息。

# showunhealthy

WARNING Flash disk has bad blocks.

FALURE - 1 sensors NOT OK

从命令输出可以看了,该Infiniband交换机的SSD模块存在数据坏块。(Infiniband交换机上运行着一个小型的Linux系统,Linux系统就存放在SSD模块中)

 

2.2 SSD模块存在坏块,最简单的办法就是更换整台Infiniband交换机,当然了,最省钱的办法就是只更换SSD模块。将原来SSD模块中的数据全部复制至新的SSD模块后,重新启动该Infiniband交换机。大概过了十几分钟左右,该Infiniband交换机又发出很大的声音,感觉是机器又重启了。同时,还有另外 一个非常怪的现象,更换完SSD模块后,该Infiniband交换机的管理IP无法 ping通。

 

2.3 趁着Infiniband交换机重启之前的间隙,赶紧收集了message日志。

 从message日志可以看了,在更换完SSD模块之后,Infiniband交换机自动启动了三次,每次间隔大概20分钟左右。每次重启之前,基本上如下图所示,除了一处可疑之外,没有任何的异常。

 依据Doc ID 2340165.1,这个可疑的告警日志是无害的日志,可以忽略。 

 

2.4 目前,问题有点无解。Infiniband交换机能正常启动,但会莫名其妙地重启,并且重启之前没有严重的故障日志产生,继续分析message日志,这次分析了 从 “开始启动” 至 “下一次重新启动” 之间的所有日志,终于有所发现:

 从启动日志可以看出,sda5对应的文件系统处于readonly状态,需要恢复,恢复完成后才挂载成功,同时提示 eth0 link down,这也就是为什么交换机无法ping通的原因了。  结合这些日志,怀疑是当前的系统存在某方面的问题,才导致系统反复重启。

2.5 此时,只能尝试如下办法来解决问题:

(1). 将其他的系统镜像复制至刚刚更换的SSD模块中,然后重启Infiniband交换机。(怀疑是当前换下来的SSD模块中的系统镜像存在问题)

(2).将当前的换下来的SSD模块中的系统镜像复制至另外的SSD模块中,然后重启Infiniband交换机。(怀疑是刚刚更换的SSD模块自身存在问题)

 

2.6  将其他的系统镜像复制至刚刚更换的SSD模块中,然后重启Infiniband交换机,运行了一个多小时,没有出现重启的现象。至此,可以肯定就是当前换下来的SSD模块中的系统镜像存在问题了。接下来,完成剩余的工作,比如更新管理IP等等。最后,升级该交换机的固件版本,保持与Exadata中另外一台Infiniband交换机相同的固件版本。

 

标签:Infiniband,重启,交换机,模块,SSD,日志
From: https://www.cnblogs.com/missyou-shiyh/p/18432220

相关文章

  • 华为s5735交换机配置开启web页面
    环境win10, 华为s5735交换机配置方法华为交换机(S5735S-L24P4S-A1)该型号交换机默认不开启web管理模式。需要通过Console口配置模式开启web管理模式,方便使用图形化界面升级操作系统1.进入配置命令模式PleasePressENTER.Aninitialpasswordisrequiredforthefirstloginvia......
  • 如何快速区分普通交换机和POE交换机
    交换机除了普通交换机外还有POE交换机,POE交换机主要用来给PD受电端进行供电,免去复杂的网络设备供电接线,实现的更加方便网络覆盖。那我们该如何区分普通交换机和POE交换机呢?我们一起来了解一下吧!要判断一台交换机是普通交换机还是POE交换机,其实方法很简单,用肉眼从产品外观即可判断......
  • maven打jar包java.lang.NoClassDefFoundError,jar中没有主清单属性 的解决办法
    <build><finalName>你的包名</finalName><plugins><!--MavenShadePlugin用于将所有依赖打包到一个JAR中--><plugin><groupId>org.apache.maven.plugins</groupId>......
  • Hyper-V (NAT) + DHCP server:实现灵活的虚拟机网络(虚拟交换机路由器):类似于vmware的
    vmwareworkstation(pro)有4种内置虚拟网络交换机1:桥接:虚拟机网络就是真正的物理机网络。虚拟机之间,虚拟机和宿主机,虚拟机和其他物理机之间,通过常规的网络方式访问。2:nat网络:虚拟机之间、虚拟机和宿主机可互访;虚拟机可访问其他物理机;其他物理机【不能】访问虚拟机3:仅主机网络:虚......
  • TH反射内存交换机使用手册
    一、反射内存交换机概述 反射内存交换机是为特定的反射内存网络而设计的设备,它可以自动旁路故障节点,允许网络中的其他节点继续操作。具有多个SFP收发器端口,可使用多模或单模收发器实现不同距离的通信,并支持级联以组成更大的网络。还可通过串口或以太网端口进行状态监视、配置和控......
  • 交换机+防火墙+路由器
    1、网络拓扑图2、基础网络配置1)路由nat2)防火墙策略3)交换机vlan3、详细配置路由器:<r2>displaycurrent-configuration [V200R003C00]#sysnamer2#snmp-agentlocal-engineid800007DB03000000000000snmp-agent #clocktimezoneChina-Standard-Timeminus08:00:00#......
  • 思科交换机命令大全,网络工程师必收藏!
    基本的命令行界面(CLI)导航思科交换机的CLI界面分为以下几种模式,每种模式提供不同的命令集:用户模式(UserEXECMode):此模式提供有限的查看命令,不能进行配置操作。用户模式的提示符通常以>结尾。例如:Switch>特权模式(PrivilegedEXECMode):此模式提供更多的监控和配置命......
  • 云服务器数据盘用ssd还是高效云盘好
    选择云服务器数据盘是用SSD云盘还是高效云盘,主要取决于您的应用场景和对性能、成本的需求。以下是SSD云盘和高效云盘的一些对比,以帮助您做出选择:SSD云盘:性能:SSD云盘基于固态硬盘技术,提供高随机读写性能和低延迟,适合对I/O性能有较高要求的场景。适用场景:I/O密集型应用,如大型数据库、......
  • 《华为三台交换机堆叠的详细命令行配置示例》
    华为三台交换机堆叠的详细命令行配置示例目录目录华为三台交换机堆叠的详细命令行配置示例 在Switch1(作为主交换机)上的配置: 1. 进入系统视图2. 开启堆叠功能并设置堆叠域编号(假设为10)3. 设置堆叠优先级(假设为200,数值越大越优先成为主交换机)4. 配置堆叠端口 ......
  • 支持 128TB 超大存储,GaussDB (for MySQL) 如何轻松应对海量数据挑战
    本文分享自华为云社区《【选择GaussDB(forMySQL)的十大理由】之二:128TB超大存储》,作者:GaussDB数据库。大数据时代的挑战随着互联网、大数据等行业的迅猛发展,企业的数据流量呈现爆炸式增长,数据库作为数据存储的核心,其承载的数据量越来越大。近十年,企业数据量从GB发展到TB,甚......