H3C 7500E连接SNA网络不定期上报中断告警

关键词:
问题现象

H3C 7500E连接SNA网络不定期上报中断告警

 

一、组网需求

组网如下图所示,两台S7500E的互联接口采用双GE捆绑,上行连接两台路由器,在路由器上做相应的SNA网络配置,做为SNA网络的出口设备。下行连接IBM服务器,IBM服务器通过S7500E与路由器之间交互SNA数据,实现SNA网络的数据传输。两台路由器设置SNA的主备关系,当路由器1SNA主设备时,数据流量模型入下图所示。

二、组网图

三、问题分析

运行过程中在路由器1的日志中,发现有不定期的SNA连接中断报错,但如果将SNA的主用设备设置在路由器2,不会出现任何报错信息。说明数据经过我司S7500E捆绑端口时出现问题,通过在S7500E-1G5/0/1G2/0/11G3/0/11S7500E-2G2/0/11G3/0/11G5/0/27同时进行抓包,分析数据报文后,发现报文经过中间捆绑链路时,出现轻微的乱序错误现象,以下为抓到报文的分析截图。

1S75E-1设备的G5/0/1端口的SNA报文:

2、而其它三个点的报文监控报文却是:

 

对比红色框内的报文发现,正常情况下协议号为0004->0000->0005->0000,但是经过聚合端口出来后报文序列变为:0004->0000->0000->0005

SNA协议是一种较为严格的链路协议,轻微的乱序也会导致协议报错。发生该报文乱序的情况必须满足如下三条:

1、报文原先端口存在并发导致报文进入队列调度;

2、已知单播报文突然由于mac地址删除变为未知单播;

3、报文的MAC地址经过hash算法调度后,导致已知单播和未知单播走的路径不一致。

经过对现场的网络监控,发现S7500E的上STPTC(拓扑改变消息)报文变化很多,这个是导致已知单播报文删除并变成未知单播报文的原因,报文变为未知单播报文后,所走的路径与之前不一致,所以产生延时转发现象。

四、解决方案

杜绝不必要的mac地址删除动作,针对以上的情况,主要为STPTC报文变化太多导致,因此需要减少网络中异常的端口up/ down而造成网络中的拓扑改变,并且需要设置STP的边缘端口来减少STPTC报文发送。

 

 

案例信息

案例类型:经验案例
案例号:KMS - 19289
创建时间:2011年1月13日
更新时间:2012年8月28日
发布时间:2012/8/28 3:09:53
文章密级:游客可见
有效期:长期有效
发布者:胡孝波 [hfw0332]
点击次数:470
评论平均得分:0
关键词:
产品线:低端交换机
产品系列:
产品版本:
故障类型:

常用操作
收藏