开始新对话

未解决

此帖子已超过 5 年

2792

2012年4月25日 20:00

Brocade链路故障排错指南系列(三)连接问题

​ ​
​ ​

​Brocade​​链路故障排错指南系列(三)连接问题​

​ ​

​转载请在文首保留原文出处:​​EMC​​中文支持论坛​

​ ​

​介绍​

​ ​
​ ​

​ ​

​交换机到设备,设备到设备之间连接问题排查基本原则,具体办法和步骤。本系列一共包含八个章节:​

​ ​

​Brocade链路故障排错指南系列(一)端口初始化流程和FCP自动发现​

​ ​

​Brocade链路故障排错指南系列(二)LED灯异常​

​ ​

​Brocade链路故障排错指南系列(三)连接问题​

​ ​

​Brocade链路故障排错指南系列(四)Link Failure​

​ ​

​Brocade链路故障排错指南系列(五)Marginal links​

​ ​

​Brocade链路故障排错指南系列(六)设备Login问题​

​ ​

​Brocade链路故障排错指南系列(七)物理介质问题​

​ ​

​Brocade链路故障排错指南系列(八)-ISL链路segemented问题​

​ ​
​ ​

​更多信息​

​ ​
​ ​

​ ​

​基本原则​​ ​

​ ​

​ ​​ ​​一次只排查一条路径。如果问题发生在主机和存储之间,那么首先检查​​zone​​是否正常;然后将链路以交换机为中心一分为二,分别排查交换机到主机和交换机到存储链路是否正常。​

​ ​

​检查办法​

​ ​

​1.​​检查物理连接​

​ ​

​1.​​ ​​检查连接主机和存储的光纤线是否损坏。​

​ ​

​2.​​ ​​检查主机​​HBA​​卡和交换机​​SFP LED​​灯状态是否正常。如果异常,可以先尝试替换法看能否解决问题。​

​ ​

​3.​​ ​​必要情况下可以尝试清理​​SFP​​灰尘​

​ ​

​2.​​检查逻辑链路​

​ ​

​1.​​ ​​输入​​switchshow​​命令,检查命令输出结果,确认设备是否正常​​FLOGI​​。​

​ ​

​§​​Login​​成功的设备在交换机上面被标记为​​F_​​,​​L_​​,​​E_​​,​​EX_​​,​​VE_​​,​​VEX_​​或者​​N_Port​​,端口速率正确,状态是​​online​​,。​

​ ​

​§​​Login​​失败的设备在交换机上面被标记为​​G_​​或者​​U_Port​​(没有开启​​NPIV​​功能),状态常见有​​No_Light​​,​​No_Sync​​,​​Laser_Flt​​等。详细可以​​Fabric OS Command References, v7.0.0.pdf​

​ ​

​2.​​ ​​Slotshow –m​​检查交换机模块是否都是​​ENABLED​​状态,而非​​faulty​​,​​disabled​​或者其他不可用状态。​

​ ​

​3.​​ ​​根据具体情况参考以下操作​

​ ​

​主机侧:​

​ ​

​§​​ ​​HOST OS​​配置​

​ ​

​§​​ ​​是否使用多路径软件,配置是否正常​

​ ​

​§​​ ​​HBA​​卡和存储的驱动和​​firmware​​版本是否跟交换机兼容​

​ ​

​§​​ ​​是否安装最新驱动​

​ ​

​§​​ ​​设备​​BIOS​​配置是否正确​

​ ​

​§​​ ​​HBA​​卡配置是否正确​

​ ​

​§​​ ​​SFP​​是否跟​​HBA​​卡兼容​

​ ​

​§​​ ​​SFP​​是否跟交换机兼容​

​ ​

​§​​交换机跟主机相关配置是否正常​​ ​

​ ​

​存储侧:​

​ ​

​§​​ ​​是否安装最新驱动​

​ ​

​§​​ ​​设备​​BIOS​​配置是否正确​

​ ​

​§​​ ​​HBA​​卡配置是否正确​

​ ​

​§​​ ​​SFP​​是否跟存储​​HBA​​卡兼容​

​ ​

​§​​交换机跟存储相关配置是否正确​

​ ​

​3.​​检查​​Name Server​

​ ​

​1.​​ ​​交换机输入​​nsshow​​,确认设备是否正常​​PLOGI​​。​

​ ​

​switch:admin> ​​nsshow​

​ ​

​The Local Name Server has 9 entries { ​

​ ​

​Type Pid COS PortName NodeName TTL(sec)​

​ ​

​*N 021a00; 2,3;20:00:00:e0:69:f0:07:c6;10:00:00:e0:69:f0:07:c6; 895​

​ ​

​Fabric Port Name: 20:0a:00:60:69:10:8d:fd​

​ ​

​NL 051edc; 3;21:00:00:20:37:d9:77:96;20:00:00:20:37:d9:77:96; na​

​ ​

​FC4s: FCP [SEAGATE ST318304FC 0005]​

​ ​

​Fabric Port Name: 20:0e:00:60:69:10:9b:5b​

​ ​

​NL 051ee0; 3;21:00:00:20:37:d9:73:0f;20:00:00:20:37:d9:73:0f; na​

​ ​

​FC4s: FCP [SEAGATE ST318304FC 0005]​

​ ​

​…​

​ ​

​ ​​上面是​​nsshow​​命令的一个示范。每个成功​​PLOGI​​的设备都可以在​​nsshow​​里面找到对应的一条记录,主要关联记录设备的​​FCP支持类型​​,交换机端口号,​​FCID​​和​​WWN​​信息。​

​ ​

​§​​ ​​如果确认设备正常​​PLOGI​​,那么接下来需要排查​​zone​​是否正常。​

​ ​

​§​​ ​​如果确认设备没有正常​​PLOGI​​,可能是由于设备和交换机通信超时导致,需要检查​​HBA​​卡上有无超时相关设备,另外也需要检查交换机上面有无​​FLOGI​​或​​PLOGI​​失败的历史日志。​

​ ​

​如果设备不在​​nsshow​​命令输出结果里面,那么可以参考以下步骤继续排查​

​ ​

​2.​​ ​​交换机输入​​portloginshow​​检查端口​​PLOGI​​状态。​

​ ​

​3.​​ ​​交换机输入​​portlogdump​​查看端口详细日志​

​ ​

​4.​​ ​​交换机输入​​fcpprobeshow​​查看设备​​FCP probing​​信息,包含​​login​​成功和​​SCSI INQUERY​​历史记录​

​ ​

​ ​
​ ​

​参考​

​ ​
​ ​

​ ​

​§​​Fabric OS troubleshooting and Diagnostic Guide v7.0.0.pdf​

​ ​

​§​​Fabric OS Command References, v7.0.0.pdf​

​ ​
​ ​

​应用于​

​ ​
​ ​

​ ​

​§​​Brocade B-Series Switches​

​ ​

​ ​

​ ​
没有回复!
找不到事件!

Top