华为交换机生成树协议基础知识(一)
1、STP/RSTP简介
以太网交换网络中为了进行链路备份,提高网络可靠性,通常会使用冗余链路。
但是使用冗余链路会在交换网络上产生环路,引发广播风暴以及MAC地址表不稳定等故障现象,从而导致用户通信质量较差,甚至通信中断。
为解决交换网络中的环路问题,提出了生成树协议STP(Spanning Tree Protocol)。
运行STP协议的设备通过彼此交互信息发现网络中的环路,并有选择的对某个端口进行阻塞,最终将环形网络结构修剪成无环路的树形网络结构,从而防止报文在环形网络中不断循环,避免设备由于重复接收相同的报文造成处理能力下降。
由于STP拓扑收敛速度慢,IEEE在2001年发布了802.1W标准定义了RSTP(Rapid Spanning Tree Protocol)。RSTP在STP基础上进行了改进,实现了网络拓扑快速收敛。
在以太网交换网中部署生成树协议后,如果网络中出现环路,生成树协议通过拓扑计算,可实现:
1、消除环路:
通过阻塞冗余链路消除网络中可能存在的网络通信环路。
2、链路备份:
当前活动的路径发生故障时,激活冗余备份链路,恢复网络连通性。
STP是一个用于局域网中消除环路的协议。
运行该协议的设备通过彼此交互信息而发现网络中的环路,并适当对某些端口进行阻塞以消除环路。由于局域网规模的不断增长,生成树协议已经成为了当前最重要的局域网协议之一。
图 典型局域网络示意图
如上图所示网络中,会产生如下两种情况:
1、环路产生广播风暴,广播风暴会导致网络不可用。
上图中,假设交换设备上没有启用STP协议。
如果HostA发出广播请求,那么广播报文将被其他两台交换设备的端口port1接收,并分别从端口port2广播出去,然后端口port2又收到另一台交换设备发过来的广播报文,再分别从两台交换设备的端口port1转发,如此反复,最终导致整个网络资源被耗尽,网络瘫痪不可用。
2、MAC地址表震荡导致MAC地址表项被破坏。
即使是单播报文,也有可能导致交换设备的MAC地址表项混乱,以致破坏交换设备的MAC地址表。
假设上图所示的网络中没有广播风暴,HostA发送一个单播报文给HostB,如果此时HostB临时从网络中移去,那么交换设备上有关HostB的MAC地址表项也将被删除。
此时HostA发给HostB的单播报文,将被交换设备S1的端口port1接收,由于S1上没有相应的MAC地址转发表项,该单播报文将被转发到端口port2上,然后交换设备S2的端口port2又收到从对端port2端口发来的单播报文,然后又从port1发出去。
如此反复,在两台交换设备上,由于不间断地从端口port1、port2收到主机A发来的单播报文,交换设备会不停地修改自己的MAC地址表项,从而引起了MAC地址表的抖动。如此下去,最终导致MAC地址表项被破坏。
2、STP基本概念
1、一个根桥:
树形的网络结构必须有树根,于是STP引入了根桥(Root Bridge)概念。
对于一个STP网络,根桥在全网中只有一个,它是整个网络的逻辑中心,但不一定是物理中心。根桥会根据网络拓扑的变化而动态变化。
网络收敛后,根桥会按照一定的时间间隔产生并向外发送配置BPDU,其他设备仅对该报文进行处理,传达拓扑变化记录,从而保证拓扑的稳定。
2、两种度量:
生成树的生成计算有两大基本度量依据:ID和路径开销。
2.1、ID
ID又分为:BID(Bridge ID)和PID(Port ID)。
BID:桥ID
IEEE 802.1D标准中规定BID是由16位的桥优先级(Bridge Priority)与桥MAC地址构成。BID桥优先级占据高16位,其余的低48位是MAC地址。
在STP网络中,桥ID最小的设备会被选举为根桥。
PID:端口ID
PID由两部分构成的,高4位是端口优先级,低12位是端口号。
PID只在某些情况下(见后面)对选择指定端口有作用。
端口优先级可以影响端口在指定生成树实例上的角色。
2.2、路径开销
路径开销(Path Cost)是一个端口变量,是STP协议用于选择链路的参考值。STP协议通过计算路径开销,选择较为“强壮”的链路,阻塞多余的链路,将网络修剪成无环路的树形网络结构。
在一个STP网络中,某端口到根桥累计的路径开销就是所经过的各个桥上的各端口的路径开销累加而成,这个值叫做根路径开销(Root Path Cost)。
3、三要素选举:
从环形网络拓扑结构到树形结构,总体来说有三个要素:根桥、根端口和指定端口。
图1 STP网络结构
以下结合上图1介绍三要素。
3.1、根桥RB(Root Bridge)
根桥就是网桥ID最小的桥,通过交互配置BPDU协议报文选出最小的BID。
3.2、根端口RP(Root Port)
所谓根端口就是去往根桥路径开销最小的端口,根端口负责向根桥方向转发数据,这个端口的选择标准是依据根路径开销判定。
在一台设备上所有使能STP的端口中,根路径开销最小者,就是根端口。很显然,在一个运行STP协议的设备上根端口有且只有一个,根桥上没有根端口。
3.3、指定端口DP(Designated Port)
对于一台设备而言,与本机直接相连并且负责向本机转发配置消息的设备就是指定桥,指定桥向本机转发配置消息的端口就是指定端口。根桥上的所有端口都是指定端口,因为根桥要向所有设备发送消息。
对于一个局域网而言,负责向本网段转发配置消息的设备就是指定桥,指定桥向本网段转发配置消息的端口就是指定端口。
图2 指定桥与指定端口示意图
如上图2所示,AP1、AP2、BP1、BP2、CP1、CP2分别表示设备S1、S2、S3的端口。
S1通过端口AP1向S2转发配置消息,则S2的指定桥就是S1,指定端口就是S1的端口AP1。
与局域网LAN相连的有两台设备:S2和S3,如果S2负责向LAN转发配置消息,则LAN的指定桥就是S2,指定端口就是S2的BP2。
一旦根桥、根端口、指定端口选举成功,则整个树形拓扑建立完毕。
在拓扑稳定后,只有根端口和指定端口转发流量,其他的非根非指定端口都处于阻塞(Blocking)状态,它们只接收STP协议报文而不转发用户流量。
4、四个比较原则:
STP选举有四个比较原则,构成消息优先级向量: 根桥ID,累计根路径开销,发送设备BID,发送端口PID 。
在STP计算过程中,都遵循数值越小越好的原则。
4.1、最小BID:
用来选举根桥。
4.2、最小累计根路径开销:
用来在非根桥上选择根端口。在根桥上,每个端口到根桥的根路径开销都是0。
4.3、最小发送者BID:
当一台运行STP协议的设备要在两个以上根路径开销相等的端口之中选择根端口时,通过STP协议计算,将选择接收到的配置消息中发送者BID较小的那个端口。
如上图1所示,假设S2的BID小于S3的BID,如果S4的A、B两个端口接收到的BPDU里面的根路径开销相等,那么端口B将成为根端口。
4.4、最小PID:
用于在根路径开销相同的情况下,不阻塞最小PID的端口,而是阻塞PID值较大的端口,即PID小的为指定端口。
图3 应用到PID进行比较的拓扑
如上图3所示的情况下PID才起作用,S1的端口A的PID小于端口B的PID,由于两个端口上收到的BPDU中,根路径开销、发送交换设备BID都相同,所以消除环路的依据就只有PID。
5、五种端口状态:
运行STP协议的设备上端口状态如下表1所示。
图4 STP端口状态迁移图
端口状态迁移机制如上图4所示。
华为技术有限公司数据通信设备缺省情况处于MSTP模式,当从MSTP模式切换到STP模式,运行STP协议的设备上端口支持的端口状态仍然保持和MSTP支持的端口状态一样,支持的状态仅包括Forwarding、Learning和Discarding,如下表2所示。
对于STP,影响端口状态和端口收敛有以下3个参数。
1、Hello Time
运行STP协议的设备发送配置消息BPDU的时间间隔,用于设备检测链路是否存在故障。设备每隔Hello Time时间会向周围的设备发送hello报文,以确认链路是否存在故障。
当网络拓扑稳定之后,该计时器的修改只有在根桥修改后才有效。新的根桥会在发出的BPDU报文中填充适当的字段以向其他非根桥传递该计时器修改的信息。但当拓扑变化之后,TCN BPDU的发送不受这个计时器的管理。
2、Forward Delay
设备状态迁移的延迟时间。链路故障会引发网络重新进行生成树的计算,生成树的结构将发生相应的变化。不过重新计算得到的新配置消息无法立刻传遍整个网络,如果新选出的根端口和指定端口立刻就开始数据转发的话,可能会造成临时环路。
为此,STP采用了一种状态迁移机制,新选出的根端口和指定端口要经过2倍的Forward Delay延时后才能进入转发状态,这个延时保证了新的配置消息传遍整个网络,从而防止了临时环路的产生。
Forward Delay Timer指一个端口处于Listening和Learning状态的各自持续时间,默认是15秒。即Listening状态持续15秒,随后Learning状态再持续15秒。这两个状态下的端口会处于Blocking状态,这正是STP用于避免临时环路的关键。
3、Max Age
端口的BPDU报文老化时间,可在根桥上通过命令人为改动老化时间。
Max Age通过配置BPDU报文的传输,可保证Max Age在整网中一致。运行STP协议的网络中非根桥设备收到配置BPDU报文后,报文中的Message Age和Max Age会进行比较:
如果Message Age小于等于Max Age,则该非根桥设备继续转发配置BPDU报文。
如果Message Age大于Max Age,则该配置BPDU报文将被老化。该非根桥设备直接丢弃该配置BPDU,可认为网络直径过大,导致根桥连接失败。
如果配置BPDU是根桥发出的,则Message Age为0。否则,Message Age是从根桥发送到当前桥接收到BPDU的总时间,包括传输延时等。实际实现中,配置BPDU报文经过一个桥,Message Age增加1。
3、STP报文格式
在前面的章节中介绍了桥ID、路径开销和端口ID等信息,所有这些信息都是通过BPDU协议报文传输。
配置BPDU是一种心跳报文,只要端口使能STP,则配置BPDU就会按照Hello Time定时器规定的时间间隔从指定端口发出。
TCN BPDU是在设备检测到网络拓扑发生变化时才发出。
图1 以太网数据帧格式
以太网数据帧格式如上图1所示。
BPDU报文被封装在以太网数据帧中,目的MAC是组播MAC:01-80-C2-00-00-00,Length/Type字段为MAC数据长度,后面是LLC头,LLC之后是BPDU报文头。
通常所说的BPDU报文多数指配置BPDU。
在初始化过程中,每个桥都主动发送配置BPDU。但在网络拓扑稳定以后,只有根桥主动发送配置BPDU,其他桥在收到上游传来的配置BPDU后,才触发发送自己的配置BPDU。
配置BPDU的长度至少要35个字节,包含了桥ID、路径开销和端口ID等参数。只有当发送者的BID或端口的PID两个字段中至少有一个和本桥接收端口不同,BPDU报文才会被处理,否则丢弃。这样避免了处理和本端口信息一致的BPDU报文。
配置BPDU在以下3种情况下会产生:
只要端口使能STP,则配置BPDU就会按照Hello Time定时器规定的时间间隔从指定端口发出。
当根端口收到配置BPDU时,根端口所在的设备会向自己的每一个指定端口复制一份配置BPDU。
当指定端口收到比自己差的配置BPDU时,会立刻向下游设备发送自己的BPDU。
配置BPDU报文基本格式如下表1所示。
图2 Flags字段格式
标志字段如上图2所示,STP中只使用了其最高位和最低位。
TCN BPDU内容比较简单,只有上表1中列出的前3个字段:协议号、版本和类型。类型字段是固定值0x80,长度只有4个字节。
TCN BPDU是指在下游拓扑发生变化时向上游发送拓扑变化通知,直到根节点。
TCN BPDU在如下两种情况下会产生:
端口状态变为Forwarding状态,且该设备上至少有一个指定端口。
指定端口收到TCN BPDU,复制TCN BPDU并发往根桥。
4、BPDU报文的交互过程
网络中所有的设备使能STP协议后,每一台设备都认为自己是根桥。此时,每台设备仅仅收发配置BPDU,而不转发用户流量,所有的端口都处于Listening状态。所有设备通过交换配置BPDU后,进行选举工作,选出根桥、根端口和指定端口。
图1 初始信息交互
如上图1所示,用{}标注的四元组表示了由根桥ID(图中以S1_MAC和S2_MAC代表两台设备的BID)、累计根路径开销、发送者BID、发送端口PID构成的有序组。配置BPDU会按照Hello Timer规定的时间间隔来发送。
5、STP算法实现的基本过程
1、初始状态
由于每个桥都认为自己是根桥,所以在每个端口所发出的BPDU中,根桥字段都是用各自的BID,Root Path Cost字段是累计的到根桥的开销,发送者BID是自己的BID,端口PID是发送该BPDU端口的端口ID。
2、选择根桥
网络初始化时,网络中所有的STP设备都认为自己是“根桥”,根桥ID为自身的设备ID。通过交换配置消息,设备之间比较根桥ID,网络中根桥ID最小的设备被选为根桥。
3、选择根端口和指定端口
3.1、非根桥设备将接收最优配置消息的那个端口定为根端口。
最优配置消息的选择过程:每个端口将收到的配置消息与自己的配置消息进行比较:
如果收到的配置消息优先级较低,则将其直接丢弃,对自己的配置消息不进行任何处理;如果收到的配置消息优先级较高,则用该配置消息的内容将自己配置消息的内容替换掉。
设备将所有端口的配置消息进行比较,选出最优的配置消息。
3.2、设备根据根端口的配置消息和根端口的路径开销,为每个端口计算一个指定端口配置消息:
根桥ID替换为根端口的配置消息的根桥ID;根路径开销替换为根端口配置消息的根路径开销加上根端口对应的路径开销;发送者BID替换为自身设备的ID。
3.3、设备将计算出的配置消息与角色待定端口自己的配置消息进行比较:
如果计算出的配置消息更优,则该端口被确定为指定端口,其配置消息也被计算出的配置消息替换,并周期性地向外发送;
如果该端口自己的配置消息更优,则不更新该端口的配置消息并将该端口阻塞。该端口将不再转发数据,且只接收不发送配置消息。
3.4、最优配置消息的选择过程
每个端口将收到的配置消息与自己的配置消息进行比较:
如果收到的配置消息优先级较低,则将其直接丢弃,对自己的配置消息不进行任何处理;如果收到的配置消息优先级较高,则用该配置消息的内容将自己配置消息的内容替换掉。
设备将所有端口的配置消息进行比较,选出最优的配置消息
发表评论