问题现象

536FLB CentOS7.0系统网络不通,刀箱内部网络也不通,3B390 G2都是这样,显然不可能是3台机器网卡都有问题,或者10/24 port VC下联口都有问题!机器重启过程中观察到VCM界面downlink port 在进入系统后显示为not linked。

告警信息

Port              : 1 (Flex NIC)

Server            : enc0:1

Port Mapping      : Bay1:LOM1:1

I/O Module        : 1

Adapter Type      : HP FlexFabric 10Gb 2-port 536FLB Adapter

ID                : enc0:1:d1

Profile           : Profile_1

Network           : -- --

MAC Address       : 9C-DC-71-C7-89-60

Fabric            : -- --

SAN Uplink Port   : -- --

Port WWN          : -- --

DCC Available     : false

DCC Version       : -- --

Status            : Not Linked

Speed             : -- --

Duplex            : Half

Configured Speed  : Auto

Configured Duplex : Auto

Max VFs           : 64

Min VF Increment  : 8

原因分析

收集vcshowall日志分析,配置没有问题,VC1的X1口定义了一个Ethernet network:MGT,且是linked状态。这个问题是出现在downlink 口,首先怀疑网卡固件和驱动问题!

给用户提供了最新的536FLB网卡的固件和驱动的下载链接,用户升级过程提示成功,但重启后固件升级成功,驱动依然是旧版本!

而且重启机器过程中观察到一个新的现象:VCM界面downlink port未进入系统前是linked状态,在进入系统后立刻显示为not linked!

注释:下图是用户环境重启过程的截图:其中bay1刀片未进入OS前downlink port状态还是linked,而bay2刀片未进入OS前downlink port也是linked,进入系统后离开变成not linked

解决办法

查询了系统兼容列表,B390G2是支持CentOS 7.0的,而且用户测试其中一台机器安装Windows2012R2系统测试,网络就正常。充分证明了是系统驱动的问题!

查询Redhat官网,关于536FLB网卡在Redhat 7.0下的说明,Redhat 7.1之前的系统 536FLB网卡的驱动都是内核自带的,硬件厂商的驱动是不支持Redhat 7.0系统的!(CentOS与Redhat内核是一样,只不过是开源社区版操作系统)。

1、通过"rpm -qa | grep kmod"命令查询系统内核自带的536FLB网卡驱动。

2、然后通过"rpm -e kmod-XXXX"卸载内核自带驱动,再重新安装官网驱动,更新成功!

3、官网驱动成功安装后,VCM界面显示为linked,网络恢复正常,问题解决! 

Redhat 官网参考链接:https://access.redhat.com/articles/1220033

 

建议与总结

1、关于新安装的系统网络不通的问题,首先检查系统兼容性。

2、其次检查VC配置,如果配置没问题,那就考虑下联口,即网卡固件或者驱动。

3、如果驱动安装后不更新,那要考虑是否是系统内核自带了驱动,需要手动卸载后才可以安装新版驱动。

案例信息

案例类型:经验案例
案例号:201708310020
创建时间:2017年8月31日
更新时间:2017年9月2日
发布时间:2017/9/2 21:23:11
文章密级:游客可见
有效期:长期有效
发布者:赵晓静 [z63293]
点击次数:1028
评论平均得分:0
关键词:B390G2,536FLB,CentOS7.0,VC
产品线:x86刀片服务器
产品系列:H3C UIS刀片系统
产品版本:10/24 port VC,B390G2
故障类型:软件bug

常用操作
收藏