Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Commutateur MDS Cisco : Les hôtes perdent le chemin vers les ports frontaux (FE) du VPLEX durant une activation de zone

Summary: Lors d’une activation de zone, tous les HBA zonés sur un port frontal VPLEX sont déconnectés et perdent le chemin. Les hôtes ESX peuvent se bloquer et leur restauration peut nécessiter un redémarrage. [Scott - does this only impact ESX hosts? The summary reads "All HBAs zoned to a VPLEX" do we want to limit this to only ESX hosts, or re-word to say "Hosts may hang and required a reboot to recover?] ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

L’hôte perd les chemins.
[NOTE- Scott also see note in the summary]

L’hôte ESX se bloque et sa restauration nécessite un redémarrage. [ Scott is it just ESX hosts that can become hung? The summary states "all HBAs zoned to VPLEX"]

Dans le journal ESXi « vmkernel » :

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


Dans les journaux du firmware VPLEX :
Événement fc/4 :  « Ce port a constaté le départ du port indiqué par le fabric. »

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Scott - back to the issue of "all HBAs zoned to VPLEX" if this cisco issue impacts all HBAs zoned to VPLEX should we be showing reports of other hosts departing in the fw logs? Do we see other hosts departing same as the esx host shown above?]

Événement fc/3 : « Ce port a constaté l’arrivée du port indiqué sur le fabric. »

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Scott: do we have this data for other HBAs seen to also have arrived ? ]


Modification :
Activation de zone.
Les ports HBA et les ports frontaux VPLEX ne sont pas concernés par les modifications de zonage.
[Scott - this last sentence does not make sense, the issue, as I understand it, is when there is a ZoneSet activation on a cisco switch all HBAs and VPLEX FE ports 'are' involved. also what Cisco Switch code level(s) does this impact?]

Cause

VPLEX procède à une découverte de fabric sur tous les ports Fibre Channel (front-end, back-end et FC-WANCOM) toutes les 90 secondes et utilise pour cela la commande du serveur de noms « Get all next » (GA_NXT). Il va effectuer cette opération en dehors de la réception d’un RSCN du commutateur ou d’un PLOGI d’un HBA zoné.

En raison du bogue Cisco CSCvw75655, si VPLEX est en train d’effectuer sa découverte de fabric sur un port frontal (FE) alors qu’une activation/validation de l’ensemble de zones est en cours, il est possible que VPLEX reçoive en retour uniquement sa propre adresse Fibre Channel (FCID), qu’il suppose ainsi que tout HBA connecté n’est plus connecté au fabric, et qu’il envoie une déconnexion (PLOGO) à chaque HBA zoné. [Scott - are the VPLEX and/or switch logs that show this action taking place, the PLOGO being sent, if this can be seen on both products can we include samples of this and from which logs this is seen?]

VPLEX consignera les événements fc/4 pour chaque HBA qu’il déconnecte et, lors de la prochaine découverte de fabric de 90 secondes, lorsqu’il reçoit les informations correctes du serveur de noms de commutateur, les événements fc/3.

La façon dont le HBA gère cette déconnexion dépend de son pilote/firmware. Dans cet exemple, l’hôte ESX a bloqué et nécessite un redémarrage. [Scott - do we have data from the logs of other hosts being impacted by this event? if so can we also list some so it does not look like only ESX hosts are impacted?]

REMARQUE :
la découverte périodique des fabrics est effectuée pour garantir que VPLEX mette à jour les données de fabric, car il est possible que tous les RSCN ne puissent pas accéder à VPLEX à partir de la structure.

Resolution

Solution de contournement :

Sur le commutateur Cisco, désactivez la fonctionnalité de base de données (BD) du serveur de noms/serveur de zones comme suit :
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


REMARQUE : la fonctionnalité de BD partagée de l’ensemble de zones est simplement une méthode efficace de partage d’informations entre le serveur de noms et le serveur de zones. La désactivation de la fonctionnalité n’aura aucun impact négatif sur l’environnement.

Cisco a confirmé que la modification est un changement local, et non un changement global. Cette commande doit être exécutée sur tous les commutateurs auxquels VPLEX est rattaché. [Scott - is there a Cisco KB that talks to this issue that we can reference in this KBA?]

Correctif :

NX-OS 8.4(2c). Cette version n’a pas reçu de date de disponibilité générale (GA) par Dell EMC.
[Scott - we cannot list a fix that is not yet available from Dell EMC, once available repost this KBA for review and remove the sentence "This version has not been GA by Dell EMC"]

Additional Information

Produits (1)
Logiciels Cisco MDS 9000 NX-OS et SAN-OS

Versions affectées connues
8.3(2)

Découverte de fabric VPLEX

Exemple :
Hôte 1, hôte 2 et hôte 3 zonés sur un seul port VPLEX FE.

Port VPLEX FE : FCID 0x200b20
Hôte 1 : FCID 0x340000
Hôte 2 : FCID 0x340020
Hôte 3 : FCID 0x340040 

En cours… [Scott - what is this? this taken/copied from info? If so we can remove the "working..." info]

 

  1. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) « 0xffffff » (valeur la plus élevée)
  2. Le serveur de noms répond avec les informations détaillées du port VPLEX FE (valeur la plus faible)
  3. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) du port VPLEX FE
  4. Le serveur de noms répond avec les informations détaillées de l’hôte 1
  5. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) de l’hôte 1
  6. Le serveur de noms répond avec les informations détaillées de l’hôte 2
  7. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) de l’hôte 2
  8. Le serveur de noms répond avec les informations détaillées de l’hôte 3
  9. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) de l’hôte 3
  10. Le serveur de noms répond avec les informations détaillées du port VPLEX FE
  11. VPLEX s’arrête puisqu’il a reçu l’adresse Fibre Channel (FCID) qui a déjà été découverte (retraversée)

Bogue Cisco CSCvw75655 ...

 

  1. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) « 0xffffff » (valeur la plus élevée)
  2. Le serveur de noms répond avec les informations détaillées du port VPLEX FE (valeur la plus faible)
  3. VPLEX envoie une commande « Get All Next » au serveur de noms avec l’adresse Fibre Channel (FCID) du port VPLEX FE
  4. Le serveur de noms répond avec les informations détaillées du port VPLEX FE
  5. VPLEX s’arrête puisqu’il a reçu l’adresse Fibre Channel (FCID) qui a déjà été découverte (retraversée)

Informations supplémentaires sur le correctif pour le bogue CSCvw75655 qui a été ajouté à NX-OS 8.4(2c).
 
Rappel de la cause du bogue :
 
Ce problème se produit lorsqu’un périphérique cible émet une commande FCNS GA_NXT et qu’il obtient en retour uniquement son propre FCID, ce qui indique qu’il n’est pas zoné avec d’autres périphériques. Certains périphériques cibles émettent ces commandes GA_NXT de façon périodique ; elles ne sont pas déclenchées par RSCN ou d’autres stimulus et sont ainsi vulnérables à ce problème.
Cela est dû au fait que, lorsqu’une activation/validation de l’ensemble de zones est en cours, une petite fenêtre de temps existe dans laquelle FCNS renvoie uniquement la valeur FCID de l’émetteur dans la réponse à la commande GA_NXT et aucun des autres FCID avec lesquels il est zoné. C’est une conséquence de la fonction de base de données partagée de l’ensemble de zones qui a été implémentée dans Cisco MDS NX-OS 7.3(0)D1(1). 

 
Voici la description du correctif de Cisco :

Dans le cadre du processus d’activation, la désactivation déclenche l’effacement de la SDB. En plus de l’effacement de la SDB, elle envoie une notification à tous les abonnés. Actuellement, cela ne se fait pas. Ajout également d’une nouvelle séquence qui enverra les notifications de validation SDB séparément. Ce zonage crée la SDB et envoie une notification finale 
Le correctif est présent dans la version 8.4(2c) uniquement.

 
SDB = Zoneset Shared Database (base de données partagée de l’ensemble de zones).

Article Properties


Affected Product

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Product

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6

Last Published Date

19 Aug 2021

Version

4

Article Type

Solution