Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Cisco MDS-switch: Hosts verliezen een pad naar VPLEX Front End-poorten (FE) bij een zoneactivering

Summary: Op een zoneactivering worden alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst, afgemeld en verliezen ze een pad. ESX-hosts kunnen vastlopen en opnieuw moeten worden opgestart om te herstellen. [Scott - geldt dit alleen voor ESX-hosts? In de samenvatting staat "Alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst". Willen we dit beperken tot alleen ESX-hosts, of aanpassen tot "Hosts kunnen vastlopen en opnieuw moeten worden opgestart om te herstellen?] ...

This article applies to   This article does not apply to 

Symptoms

Host verliest paden.
[OPMERING - Scott zie ook de opmerking in de samenvatting]

ESX-host loopt vast en moet opnieuw worden opgestart om te herstellen. [Scott zijn het alleen ESX-hosts die kunnen blijven hangen? In de samenvatting staat "Alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst"]

Uit het ESXi "vmkernel"-logboek:

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


Uit de VPLEX-firmwarelogboeken:
event fc/4:  "This port has discovered the departure of the indicated port from the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Scott - terug naar het probleem van "Alle HBA's die in een zone met een VPLEX front-end-poort zijn geplaatst": als dit Cisco-probleem gevolgen heeft voor alle HBA's die met VPLEX worden gezoneerd, moeten we dan meldingen weergeven van andere hosts die vertrekken in de fw-logboeken? Zien we andere hosts die op dezelfde manier vertrekken als de ESX-host die hierboven wordt weergegeven?]

event fc/3: "This port has discovered the arrival of the indicated port on the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Scott: hebben we deze data nodig voor andere HBA's waarvan ook wordt waargenomen dat ze zijn gearriveerd? ]


Wijziging:
Zoneactivering.
HBA-poorten en VPLEX-front-end-poorten zijn niet betrokken bij de zoneringswijzigingen.
[Scott - deze laatste zin lijkt niet te kloppen, het probleem, zoals ik het begrijp, is dat wanneer er sprake is van een zonesetactivering op een Cisco-switch, alle HBA's en VPLEX FE-poorten daarbij betrokken 'zijn'. En ook: op welke Cisco-switchcodeniveaus heeft dit effect?]

Cause

VPLEX voert elke 90 seconden een infrastructuurdetectie uit op alle Fibre Channel-poorten (front-end, back-end en FC-WANCOM) en doet dit met behulp van de naamserveropdracht "Get all Next" (GA_NXT). Hiermee wordt dit uitgevoerd buiten het ontvangen van een RSCN van de switch of PLOGI van een in een zone ingedeelde HBA.

Vanwege Cisco-fout CSCvw75655 is het volgende aan de hand: indien VPLEX zijn structuurdetectie uitvoert op een front-end-poort (FE) terwijl het activeren/doorvoeren van een zoneset wordt uitgevoerd, is er een kleine kans dat VPLEX alleen zijn eigen Fibre Channel-adres (FCID) zal krijgen geretourneerd en vervolgens aanneemt dat alle HBA's die erbij zijn aangemeld, niet meer op de infrastructuur zijn aangesloten en een afmelding (PLOGO) naar elke HBA versturen die ermee in een zone is geplaatst. [Scott - is de VPLEX en/of switch-logboeken die deze actie laten zien, de PLOGO die wordt verzonden, indien dit kan worden waargenomen op beide producten kunnen we voorbeelden van dit type opnemen en van in welke logboeken dit wordt waargenomen?]

VPLEX zal de fc/4-gebeurtenissen registreren voor elke HBA die het afmeldt en fc/3-gebeurtenissen, op de volgende 90 seconden infrastructuurdetectie, wanneer het de juiste informatie ontvangt van de naamserver van de switch.

Hoe de HBA deze afmelding afhandelt, hangt af van zijn driver/firmware. De ESX-host in dit voorbeeld was vastgelopen en vereiste een herstart. [Scott - hebben we data van de logboeken van andere hosts die door deze gebeurtenis worden getroffen? Zo ja, kunnen we daarvan ook een paar weergeven, zodat het niet lijkt alsof alleen ESX-hosts hierdoor worden getroffen?]

OPMERKING:
Periodieke structuurdetectie wordt uitgevoerd om ervoor te zorgen dat VPLEX actuele structuurdata heeft, aangezien er een mogelijkheid is dat niet alle RSCN's VPLEX vanuit de structuur zullen bereiken.

Resolution

Tijdelijke oplossing:

Schakel op de Cisco-switch de functie voor gedeelde databases (db) van naamserver/zoneserver als volgt uit:
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


OPMERKING: De gedeelde-databasefunctie voor de zoneset is slechts een efficiëntie waar naamserver en zoneserver informatie delen. Het uitschakelen van de functie heeft geen negatief effect op de omgeving.

Cisco heeft bevestigd dat de wijziging een lokale wijziging is en niet een globale wijziging. Deze opdracht moet worden uitgevoerd op elke switch waarop VPLEX is aangesloten. [Scott - is er een Cisco-KB over dit probleem waarnaar we in dit KB-artikel kunnen verwijzen?]

Oplossing:

NX-OS 8.4(2c). Deze versie is nog niet door Dell EMC algemeen beschikbaar gesteld.
[Scott - we kunnen geen oplossing vermelden die nog niet beschikbaar is op Dell EMC. Zodra beschikbaar, dit KB-artikel opnieuw voor revisie plaatsen en de zin "Deze versie is nog niet door Dell EMC algemeen beschikbaar gesteld." verwijderen.]

Additional Information

Producten (1)
Cisco MDS 9000 NX-OS- en SAN-OS-software

Bekende getroffen releases
8.3(2)

VPLEX-structuurdetectie

Voorbeeld:
Host 1, Host 2 en Host 3 zijn in een zone geplaatst met één VPLEX FE-poort.

VPLEX FE-poort: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020 
Host 3: FCID 0x340040 

Working... [Scott - wat is dit? gekopieerd van info? Zo ja, dan kunnen we de "working..." info verwijderen]

 

  1. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) "0xffffff" (hoogste)
  2. Naamserver zal antwoorden met details voor VPLEX FE-poort (laagste)
  3. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) van VPLEX FE-poort
  4. Naamserver zal antwoorden met details voor Host 1
  5. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) van Host 1
  6. Naamserver zal antwoorden met details voor Host 2
  7. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) van Host 2
  8. Naamserver zal antwoorden met details voor Host 3
  9. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) van Host 3
  10. Naamserver zal antwoorden met details voor VPLEX FE-poort
  11. VPLEX stopt hier omdat het het Fibre Channel-adres (FCID) van zichzelf heeft ontvangen, dat al is gedetecteerd (opnieuw gekruist)

Cisco-fout CSCvw75655 ...

 

  1. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) "0xffffff" (hoogste)
  2. Naamserver zal antwoorden met details voor VPLEX FE-poort (laagste)
  3. VPLEX stuurt de opdracht "Get all Next" naar de naamserver met het Fibre Channel-adres (FCID) van VPLEX FE-poort
  4. Naamserver zal antwoorden met details voor VPLEX FE-poort
  5. VPLEX stopt hier omdat het het Fibre Channel-adres (FCID) van zichzelf heeft ontvangen, dat al is gedetecteerd (opnieuw gekruist)

Aanvullende informatie over de oplossing voor fout CSCvw75655 die is toegevoegd aan NX-OS 8.4(2c).
 
Ter herinnering aan wat de oorzaak van deze fout is:
 
Het probleem doet zich voor wanneer een doelapparaat een FCNS GA_NXT-opdracht uitgeeft en alleen zijn eigen FCID terugkrijgt, waarbij wordt aangegeven dat het niet met andere apparaten in een zone is geplaatst. Een bepaald doelapparaat geeft deze GA_NXT regelmatig uit; ze worden niet aangestuurd door RSCN of andere simulus, en zijn daardoor kwetsbaar voor dit probleem.
De oorzaak is dat wanneer een zonesetactivatie/-doorvoering wordt uitgevoerd er zich een kort moment voordoet waarin FCNS alleen de FCID van de uitgever zal retourneren in een GA_NXT-antwoord en geen van de andere waarmee het in een zone is geplaatst. Dit is een gevolg van de gedeelde zoneset-databasefunctie die is geïmplementeerd in Cisco MDS NX-OS 7.3(0)D1(1). 

 
Dit is de oplossingsbeschrijving van Cisco:

Als onderdeel van de activerings/deactiveringstriggers die het SDB wissen. Naast het wissen van het SDB wordt een melding naar alle abonnees verzonden. Dit wordt nu niet gedaan. Ook is een nieuwe reeks toegevoegd waarmee de SDB-doorvoermelding afzonderlijk zal worden verzonden. Hiermee wordt gezoneerd om de SDB te bouwen en één laatste melding te versturen
Er is alleen een oplossing in versie 8.4(2c).

 
Sdb = gedeelde zoneset-database.

Affected Products

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Products

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6