L'host perde percorsi.
[NOTE- Scott also see note in the summary]
L'host ESX si blocca ed è necessario un riavvio per ripristinarlo. [ Scott is it just ESX hosts that can become hung? The summary states "all HBAs zoned to VPLEX"]
Dal registro "vmkernel" dell'host ESXi:
2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0
Dai registri del firmware VPLEX:
event fc/4: "This port has discovered the departure of the indicated port from the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)] [Scott - back to the issue of "all HBAs zoned to VPLEX" if this cisco issue impacts all HBAs zoned to VPLEX should we be showing reports of other hosts departing in the fw logs? Do we see other hosts departing same as the esx host shown above?]
event fc/3: "This port has discovered the arrival of the indicated port on the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)]
[Scott: do we have this data for other HBAs seen to also have arrived ? ]
Modifica:
Attivazione di zone.
Le porte HBA e le porte front-end VPLEX non sono coinvolte nelle modifiche alla suddivisione in zone.
[Scott - this last sentence does not make sense, the issue, as I understand it, is when there is a ZoneSet activation on a cisco switch all HBAs and VPLEX FE ports 'are' involved. also what Cisco Switch code level(s) does this impact?]
VPLEX esegue l'individuazione della fabric su tutte le porte Fibre Channel (front-end, back-end e FC-WANCOM) ogni 90 secondi utilizzando il comando "Get all next" (GA_NXT) del server dei nomi. Eseguirà questa operazione oltre a ricevere un comando RSCN dallo switch o PLOGI da un HBA suddiviso in zone.
Per via del bug Cisco CSCvw75655, se VPLEX esegue l'individuazione della fabric su una porta front-end (FE) mentre è in corso un'attivazione/commit di un set di zone, è poco probabile che VPLEX riceva solo il proprio indirizzo Fibre Channel (FCID), quindi presume che qualsiasi HBA collegato al suo interno non sia più connesso alla fabric e invierà un comando di disconnessione (PLOGO) a ciascun HBA suddiviso in zone. [Scott - are the VPLEX and/or switch logs that show this action taking place, the PLOGO being sent, if this can be seen on both products can we include samples of this and from which logs this is seen?]
VPLEX registrerà gli eventi fc/4 per ogni HBA che disconnette e gli eventi fc/3 alla successiva individuazione di fabric dopo 90 secondi, quando riceve le informazioni corrette dal server dei nomi dello switch.
Il modo in cui l'HBA gestisce questa disconnessione dipende dal driver/firmware. L'host ESX in questo esempio si è bloccato e ha richiesto un riavvio. [Scott - do we have data from the logs of other hosts being impacted by this event? if so can we also list some so it does not look like only ESX hosts are impacted?]
NOTA:
Viene eseguita l'individuazione di fabric periodica per garantire che VPLEX disponga di dati di fabric aggiornati, in quanto è possibile che non tutti i comandi RSCN raggiungano VPLEX dalla fabric.
Soluzione alternativa:
Nello switch Cisco disabilitare la funzione di database (db) condiviso del server dei nomi/server delle zone come segue:
Prodotti (1)
Software Cisco MDS 9000 NX-OS e SAN-OS
Versioni note interessate
8.3(2)
Individuazione della fabric VPLEX
Esempio:
Host 1, Host 2 e Host 3 suddivisi in zone in una porta VPLEX FE singola.
Porta VPLEX FE: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020
Host 3: FCID 0x340040
Working... [Scott - what is this? this taken/copied from info? If so we can remove the "working..." info]
Bug Cisco CSCvw75655 ...