
华为交换机集群建立不成功原因分析
1、故障现象
在集群各项配置都完成且重新启动设备以后,使用display css status命令查看集群状态,发现“CSS status”为“--”或“single”(单框集群),表示集群系统没有建立成功。
2、可能原因
1、集群线缆没有插好,插头松动
2、集群线缆连接错误
3、集群功能未使能
4、集群卡或集群线缆故障
3、处理步骤
请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。
1、在用户视图下执行命令terminal monitor和terminal trapping,打开告警信息开关,观察是否有集群线缆连接错误(LE0D0VSTSA00、ES02VSTSA集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.4 hwCssConnectError和1.3.6.1.4.1.2011.5.25.183.3.3.2.19 hwCssPhyCardConnectError。EH1D2VS08000集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.15 hwCssPhyVs08ConnectError)。
如果没有告警,直接执行后面步骤2。
如果有告警,则根据告警提示信息处理。
如果有告警,表示两台交换机已经使能集群功能,且集群卡已经正常上电工作,否则集群管理模块无法检测到链路的连接情况。
从告警信息中,可以获取以下信息:
错误的连接信息,根据集群机框ID、槽位号和集群口号,可以直接找出连接错误的线缆。
正确的连接方式。
如设备不断打印告警:
Mar 31 2010 10:53:43 SYS-136 CSSM/4/CSSCONNECTERROR:OID 1.3.6.1.4.1.2011.5.25.183.3.3.2.4 Connect error, 2/13 CSS port 3 link to 1/14 port 2, this port should link to 1/13 port 2
此告警表示:框2槽位13的主控板上集群卡3号集群口连接到了框1槽位14的主控板上集群卡2号集群口,应该连接到框1槽位13的主控板上集群卡2号集群口。
按照告警信息排除故障:
告警信息中的错误 |
原因 |
处理方法 |
线缆两端连接的机框ID不同,如“2/13 CSS port 3 link to 1/14 port 2” |
表示机框ID配置正确,线缆连接错误。 |
按照告警提示,改动集群线缆连接,并保证线缆插头插牢不松动。插好后有一个机框重启,进入集群合并流程,重启之后集群建立成功。 |
线缆两端连接的机框ID相同,如“2/13 CSS port 3 link to 2/14 port 2” |
有两种可能: 线缆两端连接在同一个机框上。 线缆两端连接在两个机框上,但是两框配置了相同的机框ID。 |
使用命令display css status检查两个机框ID。 如果不同,则表示配置是正确的,线缆两端连接在同一个机框上。根据告警提示信息修改线缆连接位置。 如果相同,根据组网需求使用命令set css id修改机框ID,并重启被修改的机框。 |
如果集群系统仍然不能建立:
如果仍有集群线缆连接错误的告警,请重复此步骤重新检查。
2、检查设备是否已经使能集群功能。
使用命令display css status查看两台交换机的集群状态。
如果显示信息中出现CSS Enable为Off,则交换机的集群功能未使能。使用命令css enable使能设备的集群功能,并重启设备。
如果显示信息中出现CSS Enable为On,表示交换机已使能集群功能。请执行后面步骤3。
3、检查集群卡的工作状态。
更换集群卡时建议将主控板拔出更换,请勿带电拔插集群卡。
若设备已经使能集群功能、集群ID配置正确、集群线缆连接正确的情况下,仍然无法建立集群系统,则需要检查集群卡的工作状态。集群卡的指示灯含义及故障处理方法如下表1所示。
表1 集群卡的指示灯含义及故障处理方法 |
||
指示灯 |
含义 |
故障处理方法 |
RUN/ALM指示灯 |
红色表示单板故障,绿色表示正常工作。 |
如果两块集群卡的RUN/ALM指示灯都是红色,可能是本框的主用主控板故障,建议更换主控板。 如果只有一块集群卡的RUN/ALM指示灯是红色,可能是集群卡故障,建议更换集群卡。 |
集群ID(CSS ID)指示灯 |
表示设备的集群机框ID。目前只支持两台设备集群,只有标记为1或者2的集群ID指示灯会亮。 集群ID指示灯不亮表示发生故障。 |
如果1号和2号集群ID指示灯不亮,建议直接更换集群卡。 |
LINK指示灯(S7700/LE0D0VSTSA00、ES02VSTSA) |
常亮表示对应集群口的链路状态为UP,常灭表示对应集群口的链路状态为DOWN。 LINK指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。 |
如果某个集群口对应的LINK指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。 |
LINK/ALM指示灯(S9700&S12700/EH1D2VS08000) |
绿色常亮表示该端口状态为Up,连线正确;红色常亮表示该端口连线错误,不符合连线规则;常灭表示该端口的链路状态为Down。 LINK/ALM指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。 |
如果某个集群口对应的LINK/ALM指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。 |
4、如果执行以上步骤后故障依然存在,请收集以下信息,并联系技术支持工程师。
上述步骤的执行结果。
设备的配置文件、日志信息、告警信息。



本文地址:http://www.023wg.com/guzhang/280.html
版权声明:若无注明,本文皆为“Swiers思唯网络博客”原创,转载请保留文章出处。

