华为交换机集群介绍(二)
首页 > HuaWei > 可靠性配置   作者:杭州清默网络  2016年12月20日 12:28 星期二  字号:   评论:0 条
时间:2016-12-20 12:28   评论:0 条 

华为交换机集群介绍(二)

华为交换机集群介绍(一):http://www.023wg.com/kkxpz/396.html

8、集群链路聚合

集群支持链路聚合技术(Eth-Trunk),可以将不同成员交换机上的物理以太端口配置成一个聚合端口连接到上游或下游设备上,实现多台设备之间的链路聚合。当集群中某台成员交换机故障或聚合链路其中一条链路故障时,可通过成员交换机之间的集群线缆跨设备传输数据流量,从而保证了数据流量的可靠传输,同时实现了设备间的备份。这对于核心交换系统和要求高质量服务的网络意义重大,不但解决了聚合设备单点失效的问题,还极大提高了全网的可靠性。

 集群链路聚合.png

1 集群链路聚合1

如上图1所示,流向网络核心的流量均匀分布在聚合链路上,当其中一条链路失效时,集群链路聚合技术能够将流量通过集群线缆自动重新分布到其余链路以实现链路备份,从而提高网络可靠性。

 集群链路聚合2.png

2 集群链路聚合2

如上图2所示,流向网络核心的流量均匀分布在聚合链路上,当集群系统其中一台成员交换机故障,集群链路聚合技术能够将原来流向故障设备的流量重新分布到下游设备与另一台成员交换机相连的链路上以实现设备间的备份,从而提高网络可靠性。

 

9、集群流量本地优先转发

为保证数据流量的可靠传输和集群成员交换机的相互备份,集群组网通常使用集群链路聚合技术连接上下游设备。与单台设备环境类似,配置集群链路聚合之后,Eth-Trunk接口会通过HASH算法选择转发出接口,从而流量会跨设备转发在聚合链路上进行负载分担。

但是由于集群设备间集群线缆的带宽有限,跨设备转发流量增加了集群设备之间的带宽承载压力,同时也降低了流量转发效率。

为了提高转发效率,减少跨集群成员设备的转发流量,设备支持流量本地优先转发,即从本设备进入的流量,优先从本设备相应的接口转发出去。如果本设备无出接口或者出接口全部故障,才会从其它成员交换机的接口转发出去。

 流量本地优先转发.png

3 流量本地优先转发

如上图3所示,SwitchASwitchB组成集群,上下行加入到Eth-Trunk。如果没有本地优先转发,则从SwitchA进入的流量,会有一部分经过集群线缆,从SwitchB的物理接口转发出去。设备支持本地优先转发之后,从SwitchA进入的流量,优先从到SwitchA的接口转发,流量不经过集群线缆。

 

10、集群成员加入

集群成员加入是指向稳定运行的单框集群系统中添加一台新的交换机。

 集群成员加入示意图.png

1 集群成员加入示意图

如上图1所示,新交换机SwitchB将加入单框集群系统从而形成新的集群系统。原单框集群的交换机成为主交换机,新加入的交换机成为备交换机。

使能了集群功能的单台交换机即为单框集群。集群加入通常在以下两种情形下出现:

在建立集群时,先将一台交换机使能集群功能后重启,重启后这台交换机将进入单框集群状态。然后再使能另外一台交换机的集群功能后重启,则后启动的交换机则按照集群成员加入的流程加入集群系统,成为备交换机。

在稳定运行的两框集群场景中,将其中一台交换机重启,则这台交换机将以集群成员加入的流程重新加入集群系统,并成为备交换机。

 

11、集群合并

集群合并是指稳定运行的两个单框集群系统合并成一个新的集群系统。

 集群合并示意图.png

2 集群合并示意图

如上图2所示,两个单框集群系统将自动选出一个更优的作为合并后集群系统的主交换机。被选为主交换机的配置不变,业务也不会受到影响,框内的备用主控板将重启。而备交换机将整框重启,以集群备的角色加入新的集群系统,并将同步主交换机的配置,该交换机原有的业务也将中断。

集群合并通常在以下两种情形下出现:

1、将两台交换机分别使能集群功能后重启(重启后的两台交换机都属于单框集群),再使用集群线缆将两台交换机连接,之后会进入集群合并流程。通常情况下,不建议使用该方式形成集群。

2、集群链路或设备故障导致集群分裂。故障恢复后,分裂后的两个单框集群系统重新合并。集群合并时主交换机的选举规则为:

比较两台交换机的集群优先级,优先级高的交换机成为主交换机。当两台交换机集群优先级相同时,MAC地址小的交换机成为主交换机。当两台交换机集群优先级和MAC地址都相同时,集群ID小的交换机成为主交换机。

注意,不管是集群成员加入还是集群合并,需要确保两框的集群ID不同。如果相同,需要预先修改其中一台交换机的集群ID。在集群场景中,如果拔出一框所有的交换网板,将导致集群分裂。在该框重新插入交换网板后(框未被重启),将进入集群合并流程,该框只能竞争为备交换机,此时不由两框的集群优先级决定。

 

12、集群主控1+N备份

集群主控1+N备份是指集群系统(CSS2)中只要保证任意一框的一个主控板运行正常,两框业务仍可稳定运行。目前华为只有S12700支持。

S12700采用的是主控和交换分离的架构,主控板不在位时不影响转发,从而可以实现备框无主控集群。下面通过与传统的集群连接方式比较,以集群系统跨框转发单播报文为例,说明S12700是如何实现集群主控1+N备份的。

 主控板插集群卡连接方式跨框报文转发.png

1 主控板插集群卡连接方式跨框报文转发

传统的主控板插集群卡连接方式:跨框单播报文需要先经过本框主控板上的交换网,然后通过集群卡、集群线缆转发到对框主控板上的交换网,再从交换网转发至接口板(LPU),最后转发到相应的端口,如上图1所示。

 业务口集群连接方式跨框报文转发.png

2 业务口集群连接方式跨框报文转发

传统的业务口集群连接方式:与主控板插集群卡连接方式类似,跨框报文需要分别经过本框和对框主控板上的交换网,才能将报文转发至对框相应的端口,如上图2所示。

 交换网板插集群卡连接方式跨框报文转发.png

3 交换网板插集群卡连接方式跨框报文转发

CSS2交换网板插集群卡连接方式:跨框单播报文先经过本框的交换网板(SFU),然后通过集群卡、集群线缆转发到对框的交换网板,再从交换网板转发至接口板,最后转发到相应的端口,如上图3所示。

与传统的集群方式不同,CSS2交换网板插集群卡方式无需将数据报文上送至主控板进行转发,而是通过交换网板实现转发。

另外,当任意一框的主控板全部故障或者都被拔出时(如果是主交换机则会进行主备倒换),接口板仍可以正常工作,数据转发不受影响。

S12700在备交换机无主控状态时仍然能够以两框集群的状态正常运行,但在此过程中,设备将每隔30分钟发送一次备框无主控的告警,告警ID和名称为:CSSM_1.3.6.1.4.1.2011.5.25.183.3.3.2.16 hwCssStandbyError。在备框无主控的状态下,命令行配置功能将被屏蔽,只支持简单的查询功能,建议及时为备框插入主控板以提高集群系统的可靠性。

需要说明的是,在组建S12700集群系统时主交换机和备交换机都至少需要配置一块主控板。集群主控1+N备份功能主要适用的场景:

集群系统正常运行,一框主控板全故障时要求对业务无损。两框都是单主控组成的集群系统正常运行,更换一框主控板时要求对业务无损。

 

13、集群分裂

 集群分裂示意图.png

1 集群分裂示意图

集群建立后,系统主用主控板和系统备用主控板定时发送心跳报文来维护集群系统的状态。集群线缆、集群卡、主控板或交换网板等发生故障或者是其中一台交换机下电或重启将导致两台交换机之间失去通信。当两台交换机之间的心跳报文超时(超时时间为8秒)时,集群系统将分裂为两个单框集群系统,如上图1所示。

华为交换机集群介绍(三):http://www.023wg.com/kkxpz/407.html

 您阅读这篇文章共花了: 
二维码加载中...
技术交流:欢迎在本文下方留言或加入QQ群:647682417 互相学习。     
本文地址:http://www.023wg.com/kkxpz/406.html
版权声明:若无注明,本文皆为“杭州清默网络”原创,转载请保留文章出处。

返回顶部    首页   
版权所有:杭州清默网络    杭州清默网络