首页 > 其他分享 >3par之CRC报错

3par之CRC报错

时间:2024-09-13 09:49:17浏览次数:7  
标签:LossSync PrimSeq 端口 ---- CRC 报错 3par WWN

故障现象

某客户反映,通过 IMC管理软件查看到 3par 8200存储的两个端口:0:0:1和0:0:2,有大量的CRC相关告警,为了保障存储链路稳定,请求处理此故障。

故障分析

8200 cli% showportlesb single 0:0:1       #显示 HP 3PAR 存储系统中端口状态和统计信息

 ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq InvWord InvCRC

<0:0:1> 0x10a00 2001000 2AC03DE4F     203     3652     23    85    4152     5023

0:0:1端口有明显的CRC增长

8200 cli% showportlesb single 0:0:2
ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq  InvWord InvCRC

<0:0:2> 0x20d00 20020002AC01BE4E        8    2480       8       0     4406      0

host0   0x20000 500143802855522A        0        0       0       0        0      0

host1   0x20100 5001438028439225       0        0       0       0        0      0

host10  0x20200 10000090FAC0F1D8        0        3       0       0       14      1

host6   0x20500 10000090FAC0B96A        0    25899       2       0    68678    424

host5   0x20400 10000090FAC0B78E        1     1233       2       0    61019     82

host11  0x20300 10000090FAC0B556        0        5       0       0       17      0

host8   0x20700 10000090FAC0B221        0   170797       2       0   195421   3083

host13   0x20600 10000090FAD0F665       1   11226       4       0 101409   491523

host13有大量的CRC错误

8200 cli% showportlesb hist 0:0:1

 ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq InvWord InvCRC

<0:0:1> 0x10a00 20010002AC03DE4F      317     2153       4       0    5362   2856

 

 ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq InvWord InvCRC

<0:0:1> 0x10a00 20010002AC01BE4E      317     2153       4       0    5362   2968

 

 ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq InvWord InvCRC

<0:0:1> 0x10a00 20010002AC01BE4E      317     2153       4       0    5362   3023

0:0:1CRC错误不断增长,说明IO端口或者链路出现了问题。

8200 cli% showportlesb hist 0:0:2

 ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq  InvWord InvCRC

<0:0:2> 0x20d00 20020002AC01BE4E        8    2480       8       0     4406      0

host0   0x20000 500143802855522A        0        0       0       0        0      0

host1   0x20100 5001438028439225       0        0       0       0        0      0

host10  0x20200 10000090FAC0F1D8        0        3       0       0       14      1

host6   0x20500 10000090FAC0B96A        0    25899       2       0    68678    424

host5   0x20400 10000090FAC0B78E        1     1233       2       0    61019     82

host11  0x20300 10000090FAC0B556        0        5       0       0       17      0

host8   0x20700 10000090FAC0B221        0   170797       2       0   195421   3083

host13   0x20600 10000090FAD0F665       1   11226       4        0    101409   491523

 

ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq  InvWord InvCRC

ID    ALPA ----Port_WWN---- LinkFail LossSync LossSig PrimSeq  InvWord InvCRC

<0:0:2> 0x20d00 20020002AC01BE4E        8    2480       8       0     4406      0

host0   0x20000 500143802855522A        0        0       0       0        0      0

host1   0x20100 5001438028439225       0        0       0       0        0      0

host10  0x20200 10000090FAC0F1D8        0        3       0       0       14      1

host6   0x20500 10000090FAC0B96A        0    25899       2       0    68678    424

host5   0x20400 10000090FAC0B78E        1     1233       2       0    61019     82

host11  0x20300 10000090FAC0B556        0        5       0       0       17      0

host8   0x20700 10000090FAC0B221        0   170797       2       0   195421   3083

host13   0x20600 10000090FAD0F665       1   11226       4       0    101409   841226

通过命令输出发现host13有大量的报错,链路故障严重。

CRC产生的原因

数据在传输过程中可能会因为传输介质故障或外界的干扰而产生比特差错(使原来的0变为1,原来的1变为0),从而导致接收方接收到错误的数据。为尽量提高接收方收到数据的正确率,在接收数据之前需要对数据进行差错检测,仅当检测的结果为正确时才接收数据。

差错检测的方式有多种,常见的有奇偶校验、求和校验、CRC校验等。他们的工作原理都是发送端对数据按照某种算法计算出来校验码,将校验码和数据一起发送到接收端,然后接收端进行检验确定数。

解决思路

  • 0:0:1端口:有CRC间歇性报错,建议先更换3par存储0:0:1端口到对端交光纤交换机的SFP,更换完后执行showportlesb reset 命令进行端口重置,如果故障还存在,下一步需要更换SAN交换机和3par之间的光纤线。

  • 0:0:2端口:这个端口连接有8个主机,只有host13有crc增长,如果端口和线路有问题,将会影响该端口下的所有主机,而不会只影响host13;所以问题点应为主机光纤卡SFP—光纤线—交换机SFP之间的链路故障,需用排除法解决。

故障处理

• 0:0:1 最终更换了0:0:1的SFP和光纤线,故障解决完毕。

• 0:0:2 host13主机最终更换了HBA卡,故障解决完毕。

经验总结

处理CRC报错问题时,需要检查命令输出,确认报错出现在主机至交换机、或是交换机至存储的某一段,确认完毕后,按照如下顺序依次进行处理:

  1. Cable between the host and the SAN switch associated with the ports part of the 3PAR SAN Zone.
  2. Replace the SFP’s on the SAN switch.
  3. Replace the SFP’s on the HBA.
  4. Use a different port on the SAN Switch.
  5. Replace the HBA on the server.

标签:LossSync,PrimSeq,端口,----,CRC,报错,3par,WWN
From: https://www.cnblogs.com/OpenSourceSite/p/18411558

相关文章

  • Redis常见报错及解决方法总结
    Redis常见报错及解决方法总结Redis作为高效的内存数据库,在实际使用过程中不可避免会遇到一些问题和报错。为了帮助大家更好地应对这些问题,我将常见的Redis报错及其解决方法进行总结,并提供具体的操作步骤。1.ConnectionRefused错误描述:客户端连接Redis时,出现Connection......
  • PbootCMS网站转移后无法打开报错提示“No input file specifed”
    当PBootCMS网站在转移服务器后出现“Noinputfilespecified”的错误提示时,这通常是由于某些配置或文件问题导致的。以下是可能导致此错误的一些原因及解决方法:检查.user.ini文件:检查根目录是否含有.user.ini文件,如果有,请尝试删除该文件,然后重新访问站点。重启Web服务器......
  • PbootCMS附件上传失败报错UNKNOW: Code: 8192; Desc: stripos()
    在PBootCMS中遇到附件上传失败的报错 UNKNOW:Code:8192;Desc:stripos():Non-stringneedleswillbeinterpretedasstringsinthefuture.Useanexplicitchr()calltopreservethecurrentbehavior,这通常是因为PHP版本升级后某些函数的行为发生了变化。具体来说,st......
  • 单选和多选在table里的报错问题Blocked aria-hidden on a <input> element because the
    单选在main.js里//table单选报错问题Vue.directive('removeAriaHidden',{bind(el,binding){constariaEls=el.querySelectorAll('.el-radio__original')ariaEls.forEach((item)=>{item.removeAttribute('aria-hidden')......
  • Python打包完成后报错,如何解决?
    大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【钟爱一生】问了一个Python打包处理数据的问题,问题如下:打包完成后报错:发生错误:Missingoptionaldependency'openpyxl'.Usepiporcondatoinstallopenpyxl.哪位大佬帮我看一下错在哪了?二、实现过程后来......
  • 开启PDB时报错ORA-00800、ORA-65054
    问题描述:开启PDB时报错ORA-00800、ORA-65054,如下所示:数据库信息:账务库备库1节点IP:192.168.133.183实例名:tmis1版本:oracle19.201、告警信息2024-09-10T22:19:44.336563+08:00Errorsinfile/u01/app/oracle/diag/rdbms/tmisdg/tmis1/trace/tmis1_vktm_152164.trc(inciden......
  • # yyds干货盘点 # Python打包完成后报错,如何解决?
    大家好,我是Python进阶者。一、前言前几天在Python最强王者交流群【钟爱一生】问了一个Python打包处理数据的问题,问题如下:打包完成后报错:发生错误:Missingoptionaldependency'openpyxl'.Usepiporcondatoinstallopenpyxl.哪位大佬帮我看一下错在哪了?二、实现过程后来【隔壁......
  • 【Linux】解决无法ping通或者安装报错的问题
    关于pingwww.baidu.com不通的问题首先你需要root权限然后去修改网络解析配置:sudovim/etc/resolv.conf在后面加上nameserver8.8.8.8nameserver8.8.4.4保存后重启网络服务sudo/etc/init.d/networkingrestart如果在使用pip安装库的时候出现错误:WARNING:Ret......
  • springboot启动apache版本报错
    springbootAnincompatibleversion[1.2.32]oftheApacheTomcatNativelibraryisinstalled,whileTomcatrequiresversion[1.2.34]解决办法:到tomcat的链接地址,找对应的版本http://archive.apache.org/dist/tomcat/tomcat-connectors/native/找到1.2.34下的tomcat-......
  • 【openGauss】WDR快照无法生成或执行生成不报错,但是snapshot.snapshot为空的问题
    问题情况开启enable_wdr_snapshot后再snapshot.snapshot中差不多任何快照信息手动创建快照也还是查不到问题原因检查pg_log日志(/opt/software/log为自己的日志路径)vi/opt/software/log/omm/pg_log/dn_6001/postgresql-2024-03-06_144308.log可以发现报错信息为......