华为交换机单板无法注册和单板异常重启决方法
首页 > HuaWei > 故障处理   作者:圈哥  2016年6月16日 12:06 星期四  热度:1498°  字号:   评论:0 条
时间:2016-6-16 12:06   热度:1498°  评论:0 条 

华为交换机单板无法注册和单板异常重启决方法

 

1、单板无法注册故障现象

单板在启动过程中,长时间无法注册,RUN/ALM指示灯黄色常亮。

执行display device命令检查单板状态,字段中的“Register”为“Unregistered”。

 

2、单板无法注册可能原因

本类故障的常见原因主要包括:

1、单板没有正确安装

2、热插拔操作导致不支持热插拔的单板损坏

3、存在电子器件的告警

4、系统剩余功率不足

5、单板与设备的型号、版本不匹配

6、单板连接器故障

 

3、单板无法注册处理步骤

1、检查单板是否已经正确安装。如果没有正确安装请重新安装。

2、确认增强灵活业务子卡或集群子卡是否存在被热插拔的情况。

3、执行display alarm命令,查看所有单板或指定槽位单板的告警信息。

4、执行display power system命令,查看设备系统功率和单板功率等信息。。

    ES0D0G48VA00启动并注册需要满足三个条件:确保单板的DIMM插槽上已安装DIMM模块;确保机框是PoE机框;PoE槽位上的PoE电源正在给设备正常供电。

5、执行display version命令,查看单板的型号、版本是否与设备匹配。如果不匹配,则更换单板使单板与设备匹配。

    匹配关系:单板的型号、版本与设备的匹配关系请参考《硬件描述》手册中的版本支持部件说明。

    混插说明:LE0D0VAMPA00插到不同的机框时,需要保证其大包版本与对应产品的大包版本一致。

    插拔操作:如果高版本的单板插到低版本的设备上后,可能会导致该单板的BOOTROMBOOTLOAD软件被自动改成低版本,当该单板再插回到高版本的设备时,会出现无法启动的情况。此时请登录华为网站获取正确交换机软件版本,并在诊断视图下执行upgrade jtag slot slot-id命令,将BOOTROMBOOTLOAD软件更新到高版本。

6、重新安装或交叉验证单板,拔出单板检查连接器是否完好。

7、如果完好,请将单板再安装到原槽位,反复插拔几次单板仍无法恢复正常,则将单板安装到设备的其它槽位。 如果连接器上存在多余的小孔,则通过手电观察背板对应槽位是否存在倒针。

8、如果还是不行只有联系华为获取技术支持。

 

4、单板异常重启故障现象

设备打印单板复位重启告警。

 

5、单板异常重启可能原因及处理步骤

执行display reset-reason命令查看单板复位的原因。

单板常见的复位告警信息及处理方法如下表1所示。

1 单板常见的复位告警信息及处理方法

原因描述

处理方法

加载相关

Reset for patch get state fail

  • 启动过程中出现一两次属正常情况。
  • 多次出现时,请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

Reset for patch load file fail

Reset for patch synchronize file fail

Reset for patch state compare fail

Reset slave board for memsize too little

更换备用主控板,使备用主控板与主用主控板的内存大小相同。

Reset for slave board's card statement disaccord with master's

说明仅主用主控板或仅备用主控板配置了子卡。请保证两块主控都配置了相同的子卡或者都没有配置子卡。

用户相关

reset by user command

通过命令行或者网管复位,需与用户确认复位原因。

power off by user command

vrp reset selfboard because of command

reset board by vrp cmd

reset board by snmp

the demo time of license is overtime

临时license到期而单板复位,请通过华为企业业务技术支持网站或热线电话联系华为获取license

软件相关

vrp reset selfboard because of find deadloop

请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

vrp reset selfboard because of find exception

设备管理相关

reset for no receiving mpu's heart

reset for no heart

reset for not receiving register ack from mpu

reset for state not stable

尝试拔插单板或将单板安装到设备其它槽位上,如不能解决请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

warm reset board for no register in a long time

请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

warm reset board for no receiving message in a long time

cold reset board for no receiving message in a long time

cold reset board for cpu is not active

reset for unregister but receive heartbeat info

reset for slave board class disaccord with mpu

主用主控板、备用主控板型号不一致,请保证两块主控板型号一致。

reset for lpu or slave version disaccord with mpu

请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

reset for no receiving master cpu's heart

元器件相关

reset for selftest fail

尝试拔插单板或更换槽位,如不能解决请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

reset for cpld self-test fail

reset selfboard because of initialize fsu fail

reset for fpga load failed

reset for fpga in abnormal state

reset for lanswitch chip parity error

温度相关

单板自动复位重启可能是由于工作环境温度过高导致。

  1. 执行display temperature all命令,通过“Status”字段查看设备的温度是否正常,通过“Temperature.(C)”字段查看设备各部件当前温度值。如果“Status”字段显示为minor,则执行步骤2
  2. 排除设备散热系统的异常。查看设备的风道、风扇和防尘网,保证:
    • 设备的进风口(机柜前侧和设备左侧)、出风口(设备后侧)无遮挡,有侧门将设备相互隔开。
    • 风扇运转正常。
    • 防尘网状态正常,不会造成空气无法进入设备的情况。

经过排除单板温度恢复正常后,则问题已经解决。

经过排除后单板温度仍然过高,请执行步骤3

  1. 重新插拔单板,验证单板能否注册,如果不能注册则执行步骤4
  2. 请收集信息并通过华为企业业务技术支持网站或热线电话联系华为获取技术支持。

 

收集信息方法:http://www.023wg.com/guzhang/269.html

 您阅读这篇文章共花了: 
捐赠支持:如果觉得这篇文章对您有帮助,请“扫一扫”鼓励作者!
二维码加载中...
技术交流:欢迎在本文下方留言或加入QQ群:481294053/474079428 互相学习。     
本文地址:http://www.023wg.com/guzhang/277.html
版权声明:若无注明,本文皆为“重庆网管”原创,转载请保留文章出处。

返回顶部    首页    捐赠支持   
版权所有:重庆网管    圈哥