未解决
此帖子已超过 5 年
605 消息
1
2792
Brocade链路故障排错指南系列(三)连接问题
交换机到设备,设备到设备之间连接问题排查基本原则,具体办法和步骤。本系列一共包含八个章节:
Brocade链路故障排错指南系列(一)端口初始化流程和FCP自动发现
Brocade链路故障排错指南系列(四)Link Failure
Brocade链路故障排错指南系列(五)Marginal links
Brocade链路故障排错指南系列(六)设备Login问题
Brocade链路故障排错指南系列(八)-ISL链路segemented问题
更多信息
基本原则
一次只排查一条路径。如果问题发生在主机和存储之间,那么首先检查zone是否正常;然后将链路以交换机为中心一分为二,分别排查交换机到主机和交换机到存储链路是否正常。
检查办法
1.检查物理连接
1. 检查连接主机和存储的光纤线是否损坏。
2. 检查主机HBA卡和交换机SFP LED灯状态是否正常。如果异常,可以先尝试替换法看能否解决问题。
3. 必要情况下可以尝试清理SFP灰尘
2.检查逻辑链路
1. 输入switchshow命令,检查命令输出结果,确认设备是否正常FLOGI。
§Login成功的设备在交换机上面被标记为F_,L_,E_,EX_,VE_,VEX_或者N_Port,端口速率正确,状态是online,。
§Login失败的设备在交换机上面被标记为G_或者U_Port(没有开启NPIV功能),状态常见有No_Light,No_Sync,Laser_Flt等。详细可以Fabric OS Command References, v7.0.0.pdf
2. Slotshow –m检查交换机模块是否都是ENABLED状态,而非faulty,disabled或者其他不可用状态。
3. 根据具体情况参考以下操作
主机侧:
§ HOST OS配置
§ 是否使用多路径软件,配置是否正常
§ HBA卡和存储的驱动和firmware版本是否跟交换机兼容
§ 是否安装最新驱动
§ 设备BIOS配置是否正确
§ HBA卡配置是否正确
§ SFP是否跟HBA卡兼容
§ SFP是否跟交换机兼容
§交换机跟主机相关配置是否正常
存储侧:
§ 是否安装最新驱动
§ 设备BIOS配置是否正确
§ HBA卡配置是否正确
§ SFP是否跟存储HBA卡兼容
§交换机跟存储相关配置是否正确
3.检查Name Server
1. 交换机输入nsshow,确认设备是否正常PLOGI。
switch:admin> nsshow
The Local Name Server has 9 entries {
Type Pid COS PortName NodeName TTL(sec)
*N 021a00; 2,3;20:00:00:e0:69:f0:07:c6;10:00:00:e0:69:f0:07:c6; 895
Fabric Port Name: 20:0a:00:60:69:10:8d:fd
NL 051edc; 3;21:00:00:20:37:d9:77:96;20:00:00:20:37:d9:77:96; na
FC4s: FCP [SEAGATE ST318304FC 0005]
Fabric Port Name: 20:0e:00:60:69:10:9b:5b
NL 051ee0; 3;21:00:00:20:37:d9:73:0f;20:00:00:20:37:d9:73:0f; na
FC4s: FCP [SEAGATE ST318304FC 0005]
…
上面是nsshow命令的一个示范。每个成功PLOGI的设备都可以在nsshow里面找到对应的一条记录,主要关联记录设备的FCP支持类型,交换机端口号,FCID和WWN信息。
§ 如果确认设备正常PLOGI,那么接下来需要排查zone是否正常。
§ 如果确认设备没有正常PLOGI,可能是由于设备和交换机通信超时导致,需要检查HBA卡上有无超时相关设备,另外也需要检查交换机上面有无FLOGI或PLOGI失败的历史日志。
如果设备不在nsshow命令输出结果里面,那么可以参考以下步骤继续排查
2. 交换机输入portloginshow检查端口PLOGI状态。
3. 交换机输入portlogdump查看端口详细日志
4. 交换机输入fcpprobeshow查看设备FCP probing信息,包含login成功和SCSI INQUERY历史记录
参考
§Fabric OS troubleshooting and Diagnostic Guide v7.0.0.pdf
§Fabric OS Command References, v7.0.0.pdf
应用于
§Brocade B-Series Switches