【思唯网络学院】华为交换机集群建立不成功原因分析
首页 > >   作者:浙江思唯网络  2019年11月22日 17:35 星期五  字号:   评论:0 条
时间:2019-11-22 17:35   评论:0 条 
1、故障现象
    在集群各项配置都完成且重新启动设备以后,使用display css status命令查看集群状态,发现“CSS status”为“--”或“single”(单框集群),表示集群系统没有建立成功。

2、可能原因
    1、集群线缆没有插好,插头松动
    2、集群线缆连接错误
    3、集群功能未使能
    4、集群卡或集群线缆故障

3、处理步骤
    请保存以下步骤的执行结果,以便在故障无法解决时快速收集和反馈信息。
    1、在用户视图下执行命令terminal monitorterminal trapping,打开告警信息开关,观察是否有集群线缆连接错误(LE0D0VSTSA00、ES02VSTSA集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.4 hwCssConnectError和1.3.6.1.4.1.2011.5.25.183.3.3.2.19 hwCssPhyCardConnectError。EH1D2VS08000集群卡告警OID号为1.3.6.1.4.1.2011.5.25.183.3.3.2.15 hwCssPhyVs08ConnectError)。
    如果没有告警,直接执行后面步骤2。
    如果有告警,则根据告警提示信息处理。
    如果有告警,表示两台交换机已经使能集群功能,且集群卡已经正常上电工作,否则集群管理模块无法检测到链路的连接情况。
    从告警信息中,可以获取以下信息:
    错误的连接信息,根据集群机框ID、槽位号和集群口号,可以直接找出连接错误的线缆。
    正确的连接方式。
    如设备不断打印告警:
    Mar 31 2010 10:53:43 SYS-136 CSSM/4/CSSCONNECTERROR:OID 1.3.6.1.4.1.2011.5.25.183.3.3.2.4 Connect error, 2/13 CSS port 3 link to 1/14 port 2, this port should link to 1/13 port 2
    此告警表示:框2槽位13的主控板上集群卡3号集群口连接到了框1槽位14的主控板上集群卡2号集群口,应该连接到框1槽位13的主控板上集群卡2号集群口。
    按照告警信息排除故障:
告警信息中的错误
原因
处理方法
    线缆两端连接的机框ID不同,如“2/13 CSS port 3 link to 1/14 port 2”
    表示机框ID配置正确,线缆连接错误。
    按照告警提示,改动集群线缆连接,并保证线缆插头插牢不松动。插好后有一个机框重启,进入集群合并流程,重启之后集群建立成功。
    线缆两端连接的机框ID相同,如“2/13 CSS port 3 link to 2/14 port 2”
    有两种可能:
    线缆两端连接在同一个机框上。
    线缆两端连接在两个机框上,但是两框配置了相同的机框ID。
    使用命令display css status检查两个机框ID。
    如果不同,则表示配置是正确的,线缆两端连接在同一个机框上。根据告警提示信息修改线缆连接位置。
    如果相同,根据组网需求使用命令set css id修改机框ID,并重启被修改的机框。
     如果集群系统仍然不能建立:
    如果仍有集群线缆连接错误的告警,请重复此步骤重新检查。
    如果没有出现集群线缆连接错误的告警,请执行后面步骤3。
    2、检查设备是否已经使能集群功能。
使用命令display css status查看两台交换机的集群状态。
    如果显示信息中出现CSS EnableOff,则交换机的集群功能未使能。使用命令css enable使能设备的集群功能,并重启设备。
    如果显示信息中出现CSS EnableOn,表示交换机已使能集群功能。请执行后面步骤3。
    3、检查集群卡的工作状态。
    更换集群卡时建议将主控板拔出更换,请勿带电拔插集群卡。
    若设备已经使能集群功能、集群ID配置正确、集群线缆连接正确的情况下,仍然无法建立集群系统,则需要检查集群卡的工作状态。集群卡的指示灯含义及故障处理方法如下表1所示。
表1 集群卡的指示灯含义及故障处理方法
指示灯
含义
故障处理方法
RUN/ALM指示灯
    红色表示单板故障,绿色表示正常工作。
   如果两块集群卡的RUN/ALM指示灯都是红色,可能是本框的主用主控板故障,建议更换主控板。
    如果只有一块集群卡的RUN/ALM指示灯是红色,可能是集群卡故障,建议更换集群卡。
集群ID(CSS ID)指示灯
    表示设备的集群机框ID。目前只支持两台设备集群,只有标记为1或者2的集群ID指示灯会亮。
    集群ID指示灯不亮表示发生故障。
    如果1号和2号集群ID指示灯不亮,建议直接更换集群卡。
LINK指示灯(S7700/LE0D0VSTSA00、ES02VSTSA)
    常亮表示对应集群口的链路状态为UP,常灭表示对应集群口的链路状态为DOWN。
    LINK指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。
    如果某个集群口对应的LINK指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。
LINK/ALM指示灯(S9700&S12700/EH1D2VS08000)
    绿色常亮表示该端口状态为Up,连线正确;红色常亮表示该端口连线错误,不符合连线规则;常灭表示该端口的链路状态为Down。
    LINK/ALM指示灯常亮只能表示对应集群口的链路状态为UP,不能反映是否有流量。
    如果某个集群口对应的LINK/ALM指示灯不亮,可能是相关集群线缆有问题,建议更换集群线缆。
4、如果执行以上步骤后故障依然存在,请收集以下信息,并联系技术支持工程师。
    上述步骤的执行结果。

    设备的配置文件、日志信息、告警信息。

目前CCIE RS 笔试和LAB 稳定,持续过人中,了解之前的PASS情况和咨询考试情况

请加QQ:804990984 , 839898248

技术交流请加群:859273036,备注博客

扫描二维码也可以加群哦:
技术交流群.jpg

 您阅读这篇文章共花了: 
 本文无需标签!
二维码加载中...
技术交流:欢迎在本文下方留言或加入QQ群:859273036 互相学习。     
本文地址:http://www.023wg.com/684.html
版权声明:若无注明,本文皆为“思唯网络学院博客”原创,转载请保留文章出处。

返回顶部    首页   
版权所有:思唯网络学院博客    浙江思唯网络