华为交换机集群建立不成功原因分析
首页 > HuaWei > 故障处理   作者:圈哥  2016年6月20日 12:33 星期一  字号:   评论:0 条
时间:2016-6-20 12:33   评论:0 条 

华为交换机集群建立不成功原因分析

 

1、故障现象

    在集群各项配置都完成且重新启动设备以后,使用display css status命令查看集群状态,发现“CSS status”为“--”或“single”(单框集群),表示集群系统没有建立成功。

 

2、可能原因

    1、集群线缆没有插好,插头松动

    2、集群线缆连接错误

    3、集群功能未使能

    4、集群卡或集群线缆故障

 

3、处理步骤

    请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。

    1、在用户视图下执行命令terminal monitorterminal trapping,打开告警信息开关,观察是否有集群线缆连接错误(LE0D0VSTSA00ES02VSTSA集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.4 hwCssConnectError1.3.6.1.4.1.2011.5.25.183.3.3.2.19 hwCssPhyCardConnectErrorEH1D2VS08000集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.15 hwCssPhyVs08ConnectError)。

    如果没有告警,直接执行后面步骤2

    如果有告警,则根据告警提示信息处理。

    如果有告警,表示两台交换机已经使能集群功能,且集群卡已经正常上电工作,否则集群管理模块无法检测到链路的连接情况。

    从告警信息中,可以获取以下信息:

    错误的连接信息,根据集群机框ID、槽位号和集群口号,可以直接找出连接错误的线缆。

    正确的连接方式。

    如设备不断打印告警:

    Mar 31 2010 10:53:43 SYS-136 CSSM/4/CSSCONNECTERROR:OID 1.3.6.1.4.1.2011.5.25.183.3.3.2.4 Connect error, 2/13 CSS port 3 link to 1/14 port 2, this port should link to 1/13 port 2

    此告警表示:框2槽位13的主控板上集群卡3号集群口连接到了框1槽位14的主控板上集群卡2号集群口,应该连接到框1槽位13的主控板上集群卡2号集群口。

    按照告警信息排除故障:

告警信息中的错误

原因

处理方法

    线缆两端连接的机框ID不同,如“2/13 CSS port 3 link to 1/14 port 2”

    表示机框ID配置正确,线缆连接错误。

    按照告警提示,改动集群线缆连接,并保证线缆插头插牢不松动。插好后有一个机框重启,进入集群合并流程,重启之后集群建立成功。

    线缆两端连接的机框ID相同,如“2/13 CSS port 3 link to 2/14 port 2”

    有两种可能:

    线缆两端连接在同一个机框上。

    线缆两端连接在两个机框上,但是两框配置了相同的机框ID

    使用命令display css status检查两个机框ID

    如果不同,则表示配置是正确的,线缆两端连接在同一个机框上。根据告警提示信息修改线缆连接位置。

    如果相同,根据组网需求使用命令set css id修改机框ID,并重启被修改的机框。

     如果集群系统仍然不能建立:

    如果仍有集群线缆连接错误的告警,请重复此步骤重新检查。

    如果没有出现集群线缆连接错误的告警,请执行后面步骤3

    2、检查设备是否已经使能集群功能。

使用命令display css status查看两台交换机的集群状态。

    如果显示信息中出现CSS EnableOff,则交换机的集群功能未使能。使用命令css enable使能设备的集群功能,并重启设备。

    如果显示信息中出现CSS EnableOn,表示交换机已使能集群功能。请执行后面步骤3

    3、检查集群卡的工作状态。

    更换集群卡时建议将主控板拔出更换,请勿带电拔插集群卡。

    若设备已经使能集群功能、集群ID配置正确、集群线缆连接正确的情况下,仍然无法建立集群系统,则需要检查集群卡的工作状态。集群卡的指示灯含义及故障处理方法如下表1所示。

1 集群卡的指示灯含义及故障处理方法

指示灯

含义

故障处理方法

RUN/ALM指示灯

    红色表示单板故障,绿色表示正常工作。

   如果两块集群卡的RUN/ALM指示灯都是红色,可能是本框的主用主控板故障,建议更换主控板。

    如果只有一块集群卡的RUN/ALM指示灯是红色,可能是集群卡故障,建议更换集群卡。

集群IDCSS ID)指示灯

    表示设备的集群机框ID。目前只支持两台设备集群,只有标记为1或者2的集群ID指示灯会亮。

    集群ID指示灯不亮表示发生故障。

    如果1号和2号集群ID指示灯不亮,建议直接更换集群卡。

LINK指示灯(S7700/LE0D0VSTSA00ES02VSTSA

    常亮表示对应集群口的链路状态为UP,常灭表示对应集群口的链路状态为DOWN

    LINK指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。

    如果某个集群口对应的LINK指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。

LINK/ALM指示灯(S9700&S12700/EH1D2VS08000

    绿色常亮表示该端口状态为Up,连线正确;红色常亮表示该端口连线错误,不符合连线规则;常灭表示该端口的链路状态为Down

    LINK/ALM指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。

    如果某个集群口对应的LINK/ALM指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。

4、如果执行以上步骤后故障依然存在,请收集以下信息,并联系技术支持工程师。

    上述步骤的执行结果。

    设备的配置文件、日志信息、告警信息。

 您阅读这篇文章共花了: 
二维码加载中...
技术交流:欢迎在本文下方留言或加入QQ群:481294053/474079428互相学习。     
本文地址:http://www.023wg.com/guzhang/280.html
版权声明:若无注明,本文皆为“重庆网管”原创,转载请保留文章出处。

返回顶部    首页   
版权所有:重庆网管    圈哥