MSTP故障处理手册


第1章  MSTP故障处理

1.1  广播风暴故障处理

1.1.1  故障描述

网络中存在广播风暴。

1.1.2  故障处理流程

图1-1 广播风暴故障诊断流程图

1.1.3  故障处理步骤

1. 检查设备全局MSTP是否开启

通过命令display stp查看设备是否开启全局MSTP。如果没有开启,则在系统视图下配置stp enable开启全局MSTP

2. 检查端口MSTP是否开启

通过命令display stp interface查看端口MSTP是否开启。如果没有开启,则在接口视图下配置stp enable开启端口的MSTP

3. 检查端口是否存在STP报文超时现象

通过命令display stp history查看端口是否存在报文超时现象,例如:

<Sysname> display stp instance 2 history slot 1

 --------------- STP slot 1 history trace ---------------

 -------------------  Instance 2   ---------------------

     Port Ethernet1/1

       Role change   : ROOT->DESI Aged

       Time          : 2006/08/08 00:22:56

       Port priority : 0.00e0-fc01-6510 0 0.00e0-fc01-6510 128.1

Ethernet1/1信息的Role Change项中存在Aged字样表明端口Ethernet1/1的报文曾经超时,此时可以通过命令stp timer-factor将超时因子设置得大一些。

1.2  端口无法快速迁移故障处理

1.2.1  故障描述

端口发生链路故障或者链路故障恢复后,整个网络的流量恢复时间超过30秒。如1-2所示,Switch A为根桥,Switch BEthernet1/1Switch CEthernet1/2为根端口,Switch CEthernet1/3端口角色为AlternateSwitch BEthernet1/3为指定端口,当Switch ASwitch B之间的链路发生故障后,Switch CEthernet1/3端口计算为Designate端口后无法快速迁移到Forwarding状态,导致流量中断30秒。

图1-2 端口无法快速迁移故障处理组网图

1.2.2  故障处理流程

图1-3 端口无法快速迁移故障诊断流程图

1.2.3  故障处理步骤

1. 检查端口对端连接是否为终端

检查端口对端连接是否为终端,如果端口对端连接的是终端,请在端口上执行命令stp edge-port enable开启边缘端口属性。

2. 检查本设备是否工作在STP模式

执行命令display stp查看设备的工作模式,如果设备工作在STP模式,则使用stp mode命令将设备的工作模式修改为MSTP

3. 检查上游设备的工作模式

在上游设备上执行命令display stp查看设备的工作模式,如果上游设备工作在STP模式或者RSTP模式,则使用stp mode命令将上游设备工作模式修改为MSTP,对于工作在RSTP模式的情况,还可以在Switch BEthernet1/3端口上使用stp no-agreement-check命令开启No Agreement Check特性。

4. 检查端口是否为点对点链路

执行命令display stp interface查看端口是否为点对点链路:

<sysname> display stp interface ethernet 1/3

----[CIST][Port3(Ethernet1/3)][UP]----

 Port Protocol       :enabled

 Port Role           :CIST Disabled Port

 Port Priority       :128

 Port Cost(Legacy)   :Config=auto / Active=200000

 Desg. Bridge/Port   :0.00e0-fc00-2000 / 128.2

 Port Edged          :Config=disabled / Active=disabled

 Point-to-point      :Config=auto / Active=true

 Transmit Limit      :10 packets/hello-time

 Protection Type     :None

 MST BPDU Format     :Config=auto / Active=legacy

 Port Config-

 Digest-Snooping     :disabled

 Num of Vlans Mapped :20

 PortTimes           :Hello 2s MaxAge 20s FwDly 15s MsgAge 0s RemHop 20

 BPDU Sent           :0

          TCN: 0, Config: 0, RST: 0, MST: 0

 BPDU Received       :0

          TCN: 0, Config: 0, RST: 0, MST: 0    

Point-to-point项中Activetrue表明端口为点对点链路,如果为false则表明端口为非点对点链路。

如果端口为点对点链路还无法快速迁移,请寻求技术支持。

5. 检查端口的双工模式

执行命令display brief interface查看端口的双工模式,如果端口为半双工模式,则使用命令undo duplex将本端口和其对端端口修改为自协商模式。

如果两端端口都工作在自协商模式,请检查链路是否存在故障,如果链路出现故障,请排除此故障。

1.3  指定端口长期处于Discarding状态故障处理

1.3.1  故障描述

指定端口一直处于Discarding状态,无法迁移到Forwarding状态。

1.3.2  故障处理流程

图1-4 指定端口长期处于Discarding状态故障诊断流程图

1.3.3  故障处理步骤

1. 检查是否收到本端口自己发送的报文

执行命令debugging stp packet interface打开STP报文详细信息调试开关,查看端口是否接收到了本端口自己发送出去的报文,如果是,表明网络中存在自环,请检查网络消除自环。

2. 检查端口收到报文格式是否和配置格式一致

方法一:通过查看打印的log日志,如果有打印“Port interface-type interface-number received different format of BPDU packets ! Please change your BPDU Format configuration.”,表明端口收到了不同格式的报文。

方法二:打开端口报文调试开关查看收到报文的类型,执行命令display stp interface查看端口实际配置的报文类型,比较两者是否一致,如果不一致表明端口收到不同格式报文。

如果端口收到的报文格式和配置的格式不一致,则通过stp compliance命令修改端口的报文格式。

3. 检查端口根保护是否生效

方法一:通过查看打印的log日志,如果有打印“Instance instance-id's ROOT-Protection port interface-type interface-number received superior message!”,表明端口开启了根保护。

方法二:执行命令display stp abnormal-port查看端口是否因根保护起作用而被Discarding

<sysname> display stp abnormal-port

 MSTID      Blocked Port                 Reason

   0        Ethernet 1/4                ROOT-Protected

如果端口因启动根保护而被Discarding,请检查是否误将设备设置为根桥或备份根桥,执行命令display stp instance instance-id查看设备在实例上的根类型。如:

<sysname> display stp instance 0

-------[CIST Global Info][Mode MSTP]-------

CIST Bridge         :0.00e0-fc02-1900

Bridge Times        :Hello 2s MaxAge 20s FwDly 15s MaxHop 20

CIST Root/ERPC      :0.00e0-fc02-1900 / 0

CIST RegRoot/IRPC   :0.00e0-fc02-1900 / 0

CIST RootPortId     :0.0

BPDU-Protection     :disabled

Bridge Config-

Digest-Snooping     :disabled

CIST Root Type      :PRIMARY root

上述信息表明设备被配置为根桥。

如果根桥和备份根桥配置正确,请检查本端口是否误将根保护特性开启。如果是,请将根保护特性关闭;如果根保护特性配置正确,请通过命令display interface查看端口当前的链路状态,检查设备通往根桥的链路是否出现故障。如:

<sysname> display interface ethernet 1/1

 Ethernet1/1 current state: DOWN

 IP Packet Frame Type: PKTFMT_ETHNT_2, Hardware Address: 0000-fc00-6507

 Description: Ethernet1/1 Interface

 Loopback is not set

 Media type is twisted pair

 Port hardware type is  100_BASE_T

 Unknown-speed mode, unknown-duplex mode

如果出现了链路故障,则将故障排除。

4. 检查端口环路保护是否生效

方法一:通过查看打印的log日志,如果有打印“Instance instance-id's LOOP-Protection port interface-type interface-number received superior message!”,表明端口开启了环路保护。

方法二:执行命令display stp abnormal-port查看端口是否因环路保护起作用而被Discarding

<syaname>display stp abnormal-port

 MSTID      Blocked Port                 Reason

   0        Ethernet 1/4                 ROOT-Protected

如果端口因启动环路保护而被Discarding,请检查对端STP是否开启。如果开启STP,请检查是否出现链路拥塞或者存在单向链路故障(通过命令display stp interface检查对端端口的链路状态,对于光纤口请检查光纤的收光线和发光线是否正常)。如果是链路拥塞可以通过增大超时因子解决该问题;如果出现单向链路,则排除此故障。

1.4  端口STP DOWN故障处理

1.4.1  故障描述

执行命令display interface查看端口信息时,端口为STP DOWN。例如:

<sysname> display interface ethernet 1/1

 Ethernet1/1 current state: STP DOWN

 IP Packet Frame Type: PKTFMT_ETHNT_2, Hardware Address: 0000-fc00-6507

 Description: Ethernet1/1 Interface

 Loopback is not set

 Media type is twisted pair

 Port hardware type is  100_BASE_T

 Unknown-speed mode, unknown-duplex mode

1.4.2  故障处理流程

图1-5 端口STP DOWN故障诊断流程图

1.4.3  故障处理步骤

1. 检查BPDU保护是否生效

方法一:通过查看打印的log日志,如果有打印“BPDU-Protection port interface-type interface-number received BPDU packet!”,表明端口开启了BPDU保护。

方法二:执行命令display stp down-port查看端口是否因BPDU保护生效而被STP 关闭。例如:

<sysname> display stp down-port

 Down Port                     Reason

 Ethernet1/1                   BPDU-Protected

如果端口因BPDU保护生效而被STP DOWN,请检查对端设备是交换机还是终端,如果对端为交换机表明端口的配置错误,请执行命令undo stp edge-port将端口的边缘端口属性去掉并执行命令undo shutdown开启端口;如果对端设备为终端,表明存在恶意攻击,端口被关闭属于正常情况,请消除攻击源,然后再执行命令undo shutdown开启端口。

2. 检查报文格式是否频繁切换

方法一:通过查看打印的log日志,如果有打印“Port interface-type interface-number  received different format of BPDU packets continually! Shut it down  in order to prevent broadcast.”,表明端口因报文格式频繁切换而被关闭。

方法二:执行命令display stp down-port查看端口是否因报文格式频繁切换而被STP关闭。例如:

<sysname> display stp down-port

 Down Port                     Reason

 Ethernet1/1                   Formatfrequency-Protected

如果端口因报文格式频繁切换而被STP DOWN,请检查组网中报文格式的配置是否正确,如果配置正确,请检查是否存在恶意攻击,如果存在恶意攻击,端口被关闭属于正常情况,请消除攻击源,然后再执行命令undo shutdown开启端口,否则请寻求技术支持。

1.5  STP网络流量不稳定故障处理

1.5.1  故障描述

在一个STP的组网内,网络中流量持续不稳定,时断时续。

1.5.2  故障处理流程

图1-6 STP网络流量不稳定故障诊断流程图

1.5.3  故障处理步骤

1. 检查端口STP状态是否震荡

如果设备频繁打印下面信息表明存在链路故障或者组网错误:

<sysname> stp port-log all

%Aug 16 00:49:41:856 2006 Sysname MSTP/3/PDISC: Instance 2's Ethernet1/1 has been set to discarding state!

%Aug 16 00:49:41:856 2006 Sysname MSTP/3/PFWD: Instance 2's Ethernet1/2 has been set to forwarding state!

请确认不停打印状态切换信息的端口是否存在链路故障,如果链路无故障,请检查全网设备STP配置是否正确。

2. 请检查端口STP角色是否震荡

使用命令display stp history查看端口角色计算历史纪录,如果端口的角色不停更新且端口优先级在不停变化,表明端口收到来在不同设备的报文,表明组网错误,请消除错误组网。

3. 检查设备是否频繁收到TC报文

执行命令display stp查看收到TC报文的数量,同时查看最近一次拓扑变化时间,如果TC报文的数量一直递增且最近一次拓扑变化时间在10秒以内,那么端口肯定频繁收到TC报文。

接下来就是追溯TC源头,执行命令diplay stp tc查看频繁收到TC报文的端口,如果某端口收到的TC报文一直递增,查看该端口的对端设备的TC接收端口,一级一级往上直到找到TC源。

例如:

<sysname> display stp tc

 MSTID      Port                       Receive      Send

   0        Ethernet1/1                 17           17

   0        Ethernet1/2                 2           0

 

<sysname> display stp tc

 MSTID      Port                       Receive      Send

   0        Ethernet1/1                 25           25

   0        Ethernet1/2                 2            0

端口Ethernet1/1收到的TC数量持续增加,表明Ethernet1/1对端一直发送TC报文,继续检查Ethernet1/1对端的设备TC报文收发情况。

1.6  设备无法处于同一个MSTP域故障处理

1.6.1  故障描述

MSTP域配置(Format selector、域名、MSTP修订级别以及实例和VLAN映射关系)都相同的情况下,两台设备无法处于同一个MSTP域中,执行命令display stp brief时,CIST实例上根端口在多实例上角色为Master

1.6.2  故障处理流程

图1-7 设备无法处于同一个MSTP域故障诊断流程图

1.6.3  故障处理步骤

1. 检查本端设备运行模式

执行命令display stp查看设备当前运行模式,例如:

<Sysname> display stp

-------[CIST Global Info][Mode MSTP]-------

CIST Bridge         :0.00e0-fc00-1234

Bridge Times        :Hello 2s MaxAge 20s FwDly 15s MaxHop 20

CIST Root/ERPC      :0.00e0-fc00-1234 / 0

CIST RegRoot/IRPC   :0.00e0-fc00-1234 / 0

CIST RootPortId     :0.0

BPDU-Protection     :disabled

Bridge Config-

Digest-Snooping     :enabled

CIST Root Type      :PRIMARY root

TC or TCN received  :463

Time since last TC  :0 days 0h:17m:54s                         

上述信息表示设备当前运行模式为MSTP。如果设备运行模式不是MSTP,通过命令stp mode修改设备当前运行模式为MSTP

2. 检查对端设备是否支持标准配置摘要计算

检查对端设备是否支持标准配置摘要计算,如果对端设备不支持,则在本端设备上开启配置摘要侦听功能。

1.7  故障诊断命令

命令

说明

display stp [ instance instance-id ] [ interface interface-list | slot slot-number ] [ brief ]

显示MSTP的状态信息与统计信息

display stp abnormal-port

显示非正常阻塞的端口信息

display stp down-port

显示被STP保护功能down掉的端口信息

display stp [ instance instance-id ] history [ slot slot-number ]

显示MSTP实例端口角色计算的历史信息

display stp ignored-vlan

显示开启VLAN Ignore特性的VLAN列表

display stp region-configuration

显示已经生效的MST域的配置信息

display stp root

显示所有MSTP实例的根桥信息

display stp [ instance instance-id ] tc [ slot slot-number ]

显示MSTP实例的所有端口发送和接收的TC或者TCN报文个数

debugging stp all

打开MSTP所有的调试信息开关

debugging stp event [ interface interface-type interface-number ]

打开MSTP的端口事件调试信息开关

debugging stp fsm [ instance instance-id ] [ interface interface-type interface-number ]

打开MSTP状态机调试信息开关

debugging stp global-error

打开MSTP全局错误调试信息开关

debugging stp global-event

打开MSTP全局事件调试信息开关

debugging stp packet [ receive | send ] [ interface interface-type interface-number ] [ brief | verbose ]

打开MSTP的报文调试信息开关

debugging stp roles

打开MSTP的端口角色变化调试信息开关

debugging stp tc [ interface interface-type interface-number ]

打开MSTPTC事件调试信息开关

 

 

 

 

Copyright ©2008 杭州华三通信技术有限公司 版权所有,保留一切权利。

非经本公司书面许可,任何单位和个人不得擅自摘抄、复制本文档内容的部分或全部,并不得以任何形式传播。

本文档中的信息可能变动,恕不另行通知。

附件下载

不同款型规格的资料略有差异, 详细信息请向具体销售和800咨询。 H3C保留在没有任何通知或提示的情况下对资料内容进行修改的权利!