问题现象

 客户现场使用两台M9010配置IRF2堆叠,在堆叠完成后发现日志中chassis 2中的所有板卡均在不停的从NormalFault之间来回切换。通过“display device verbose”查询到目前设备侧两块主控和两块四代防火墙插卡均无法识别。

 

原因分析

1、在堆叠未成功情况下从主设备上将logfile文件下载下来,在设备保存的日志中发现,其实业务板卡和主控板卡是可以被识别的。

%@767%Mar 20 21:30:46:859 2018 H3C DEV/5/BOARD_STATE_NORMAL: Board state changed to Normal on chassis 2 slot 3, type is NSQM1FWDFG0.

%@768%Mar 20 21:30:46:909 2018 H3C DEV/5/BOARD_STATE_NORMAL: Board state changed to Normal on chassis 2 slot 2, type is NSQM1FWDFG0.

2、从收集堆叠分裂后主设备保存的配置文件中可见一斑,在保存的配置文件中配置是正常的(IRF堆叠是能正常建立的)。

  ===============display saved-configuration=============== 

#

version 7.1.064, Release 9121P24

#

sysname SXXX-2#IDC-B003-L05&06-BFQ-FW01&02-H3CM9010

。。。。。。(此处省略无关配置)

#

irf-port 1/2

port group interface FortyGigE1/6/0/35 mode enhanced

port group interface FortyGigE1/6/0/36 mode enhanced

port group interface FortyGigE1/7/0/36 mode enhanced

#

irf-port 2/1

port group interface FortyGigE2/6/0/35 mode enhanced

port group interface FortyGigE2/6/0/36 mode enhanced

port group interface FortyGigE2/7/0/35 mode enhanced

port group interface FortyGigE2/7/0/36 mode enhanced

3、接着再去查日志,发现一个很有趣的问题,在端口2/7/0/35端口不能收到IRF包后,其他IRF端口也跟着DOWN掉了。所以出现了之前现场出现的日志中板卡从NormalFault之间不停的切换。原因就在这里!

%@747%Mar 20 21:27:15:210 2018 H3C DRVPLAT/4/DrvDebug: -Chassis=2-Slot=7;

 The port Forty2/7/0/35 can't receive irf pkt and has been changed to inactive status, please check.

%@748%Mar 20 21:27:17:544 2018 H3C IFNET/3/PHY_UPDOWN: Physical state on the interface FortyGigE1/7/0/35 changed to down.

%@749%Mar 20 21:27:17:545 2018 H3C IFNET/5/LINK_UPDOWN: Line protocol state on the interface FortyGigE1/7/0/35 changed to down.

%@750%Mar 20 21:27:23:565 2018 H3C IFNET/3/PHY_UPDOWN: Physical state on the interface FortyGigE1/7/0/36 changed to down.

%@751%Mar 20 21:27:23:565 2018 H3C IFNET/5/LINK_UPDOWN: Line protocol state on the interface FortyGigE1/7/0/36 changed to down.

4、既然原因已经明了了,那么就来看到底Forty2/7/0/35为什么会出现不能接受IRF协商包?

而在配置中看到:

A堆叠设备:

#

irf-port 1/2

port group interface FortyGigE1/6/0/35 mode enhanced

port group interface FortyGigE1/6/0/36 mode enhanced

port group interface FortyGigE1/7/0/36 mode enhanced

B堆叠设备:

#

irf-port 2/1

port group interface FortyGigE2/6/0/35 mode enhanced

port group interface FortyGigE2/6/0/36 mode enhanced

port group interface FortyGigE2/7/0/35 mode enhanced

port group interface FortyGigE2/7/0/36 mode enhanced

日志中报错的端口正好是在A设备中没有配置的端口,所以由此判断在堆叠配置中IRF PORT中的端口必须对应。也就是主框和备框之间接口数量、端口编号必须一致。

解决办法

1、删除B设备中“port group interface FortyGigE2/7/0/35 mode enhanced

”命令。

#

irf-port 2/1

port group interface FortyGigE2/6/0/35 mode enhanced

port group interface FortyGigE2/6/0/36 mode enhanced

port group interface FortyGigE2/7/0/35 mode enhanced

port group interface FortyGigE2/7/0/36 mode enhanced

2、在A设备中添加“port group interface FortyGigE1/7/0/35 mode enhanced

”命令。

#

irf-port 1/2

port group interface FortyGigE1/6/0/35 mode enhanced

port group interface FortyGigE1/6/0/36 mode enhanced

port group interface FortyGigE1/7/0/35 mode enhanced

port group interface FortyGigE1/7/0/36 mode enhanced

建议与总结

不仅是M9000设备在堆叠的时候注意堆叠端口数量和类型需要对应,在其他网络设备做堆叠中也需要注意此问题。

案例信息

案例类型:经验案例
案例号:201804160007
创建时间:2018年4月16日
更新时间:2018年4月23日
发布时间:2018/4/23 16:23:16
文章密级:游客可见
有效期:长期有效
发布者:刘嘉炜 [lfw1769]
点击次数:39795
评论平均得分:5.00
关键词:M9000堆叠 主控引擎
产品线:安全产品
产品系列:M9000系列
产品版本:9121P24
故障类型:

常用操作
收藏