Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Cisco MDS -kytkin: Isännät kadottavat VPLEX-etuporttien (FE) polun vyöhykkeen aktivoinnin yhteydessä

Summary: Vyöhykettä aktivoitaessa kaikki VPLEX-etuporttiin vyöhykkeistetyt HBA:t kirjautuvat ulos ja menettävät polun. ESX-isännät saattavat lakata vastaamasta ja palautua vain uudelleenkäynnistyksellä. [Scott - does this only impact ESX hosts? The summary reads "All HBAs zoned to a VPLEX" do we want to limit this to only ESX hosts, or re-word to say "Hosts may hang and required a reboot to recover?] ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Isäntä kadottaa polkuja.
[NOTE- Scott also see note in the summary]

ESX-isäntä lakkaa vastaamasta, ja sen palautuminen edellyttää uudelleenkäynnistystä. [ Scott is it just ESX hosts that can become hung? The summary states "all HBAs zoned to VPLEX"]

ESXin vmkernel-lokissa:

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


From the VPLEX firmware logs :
event fc/4:  "This port has discovered the departure of the indicated port from the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Scott - back to the issue of "all HBAs zoned to VPLEX" if this cisco issue impacts all HBAs zoned to VPLEX should we be showing reports of other hosts departing in the fw logs? Do we see other hosts departing same as the esx host shown above?]

event fc/3: "This port has discovered the arrival of the indicated port on the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Scott: do we have this data for other HBAs seen to also have arrived ? ]


Change:
Zone activation.
HBA ports and VPLEX front end ports are not involved in the zoning changes.
[Scott - this last sentence does not make sense, the issue, as I understand it, is when there is a ZoneSet activation on a cisco switch all HBAs and VPLEX FE ports 'are' involved. also what Cisco Switch code level(s) does this impact?]

Cause

VPLEX tekee kuituhaun kaikissa kuitukanavaporteissa (etu- ja takaportti sekä FC-WANCOM) 90 sekunnin välein käyttäen nimipalvelimen Get all next (GA_NXT) -komentoa. Se tekee tämän, ellei saa RSCN:ää kytkimestä tai vyöhykkeeseen määritetyn HBA:n PLOGIsta.

Cisco-virheen CSCvw75655 vuoksi: jos VPLEX tekee kuituhaun etuportissa (FE), kun vyöhykejoukon aktivointi/käyttöönotto on meneillään, VPLEX saattaa harvoissa tilanteissa saada takaisin vain oman kuitukanavaosoitteensa (FCID). Se olettaa, että siihen kirjautuneet HBA:t eivät ole enää yhteydessä kuituverkkoon, ja lähettää uloskirjauksen (PLOGO) kaikkiin saman vyöhykkeen HBA:ihin. [Scott - are the VPLEX and/or switch logs that show this action taking place, the PLOGO being sent, if this can be seen on both products can we include samples of this and from which logs this is seen?]

VPLEX kirjaa kunkin uloskirjautuvan HBA:n fc/4- ja fc/3-tapahtumat seuraavan 90 sekunnin kuluttua tekemässään kuituhaussa saadessaan oikeat tiedot kytkimen nimipalvelimesta.

Uloskirjautumisen käsittely HBA:ssa määräytyy ohjaimen/laiteohjelmiston mukaan. Tässä esimerkissä ESX-isäntä lakkasi vastaamasta ja edellytti uudelleenkäynnistystä. [Scott - do we have data from the logs of other hosts being impacted by this event? if so can we also list some so it does not look like only ESX hosts are impacted?]

HUOMAUTUS:
ajoittaisen kuituhaun tarkoituksena on varmistaa, että VPLEX:n kuitutiedot ovat ajan tasalla, koska kaikki RSCN:t eivät välttämättä saavuta VPLEXiä kuituverkosta.

Resolution

Kiertotapa:

Poista Cisco-kytkimessä käytöstä nimipalvelimen/vyöhykepalvelimen jaettu tietokantatoiminto seuraavasti:
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


HUOMAUTUS: Vyöhykejoukon jaettu tietokantatoiminto on ainoastaan tapa, jolla nimi- ja vyöhykepalvelin jakavat tietoja. Ominaisuuden poistamisen käytöstä ei pitäisi vaikuttaa ympäristöön negatiivisesti.

Cisco on vahvistanut, että muutos on paikallinen, ei yleinen. Tämä komento on suoritettava kaikissa kytkimissä, joihin on liitetty VPLEX. [Scott - is there a Cisco KB that talks to this issue that we can reference in this KBA?]

Korjaus:

NX-OS 8.4(2c). Tälle versiolle ei ole Dell EMC:n GA-korjausta.
[Scott - we cannot list a fix that is not yet available from Dell EMC, once available repost this KBA for review and remove the sentence "This version has not been GA by Dell EMC"]

Additional Information

Tuotteet (1)
Cisco MDS 9000 NX-OS- ja SAN-OS-ohjelmisto

Tunnetut julkaisut, joihin ongelma vaikuttaa
8.3(2)

VPLEX Fabric Discovery

Esimerkki:
Isäntien 1, 2 ja 3 vyöhykkeeksi on määritetty yksi VPLEX FE -portti.

VPLEX FE port: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020 
Host 3: FCID 0x340040 

Working... [Scott - what is this? this taken/copied from info? If so we can remove the "working..." info]

 

  1. VPLEX lähettää Get all next -komennon nimipalvelimeen 0xffffff:n (ylin) kuitukanavaosoitteella (FCID)
  2. Nimipalvelin vastaa ja antaa VPLEX FE -portin (alin) tiedot
  3. VPLEX lähettää Get all next -komennon nimipalvelimeen VPLEX FE -portin kuitukanavaosoitteella (FCID)
  4. Nimipalvelin vastaa ja antaa isännän 1 tiedot
  5. VPLEX lähettää Get all next -komennon nimipalvelimeen isännän 1 kuitukanavaosoitteella (FCID)
  6. Nimipalvelin vastaa ja antaa isännän 2 tiedot
  7. VPLEX lähettää Get all next -komennon nimipalvelimeen isännän 2 kuitukanavaosoitteella (FCID)
  8. Nimipalvelin vastaa ja antaa isännän 3 tiedot
  9. VPLEX lähettää Get all next -komennon nimipalvelimeen isännän 3 kuitukanavaosoitteella (FCID)
  10. Nimipalvelin vastaa ja antaa VPLEX FE -portin tiedot
  11. VPLEX pysähtyy, koska se on vastaanottanut oman kuitukanavaosoitteensa (FCID), joka on jo tunnistettu

Cisco-virhe CSCvw75655 ...

 

  1. VPLEX lähettää Get all next -komennon nimipalvelimeen 0xffffff:n (ylin) kuitukanavaosoitteella (FCID)
  2. Nimipalvelin vastaa ja antaa VPLEX FE -portin (alin) tiedot
  3. VPLEX lähettää Get all next -komennon nimipalvelimeen VPLEX FE -portin kuitukanavaosoitteella (FCID)
  4. Nimipalvelin vastaa ja antaa VPLEX FE -portin tiedot
  5. VPLEX pysähtyy, koska se on vastaanottanut oman kuitukanavaosoitteensa (FCID), joka on jo tunnistettu

Lisätietoja virheen CSCvw75655 korjauksesta, joka on lisätty kohteeseen NX-OS 8.4(2c).
 
Muistutus virheen syystä:
 
Ongelma ilmenee, kun kohdelaite antaa FCNS GA_NXT -komennon ja saa takaisin vain oman FCID-osoitteensa, mikä tarkoittaa, että sitä ei ole määritetty samaan vyöhykkeeseen muiden laitteiden kanssa. Jotkin kohdelaitteet antavat näitä GA_NXT-komentoja ajoittain ilman RSCN:ää tai muuta käynnistintä, ja ovat siten herkkiä tälle ongelmalle.
Ongelma johtuu siitä, että kun vyöhykejoukon aktivointi/käyttöönotto on meneillään, tiettynä lyhyenä ajankohtana FCNS palauttaa vain antajan FCID-osoitteen vastauksena GA_NXT-komentoon eikä muiden, joiden kanssa se on samalla vyöhykkeellä. Tämä johtuu vyöhykejoukon jaetusta tietokantatoiminnosta, joka otettiin käyttöön Cisco MDS NX-OS 7.3(0)D1(1) -versiossa. 

 
Tämä on korjauksen kuvaus Ciscolta:

Aktivoinnin osana käytöstäpoisto käynnistyy, mikä tyhjentää SDB:n. SDB:n tyhjennyksen lisäksi se lähettää ilmoituksen kaikille tilaajille. Nyt näin ei tapahdu. Lisäksi on lisätty uusi sekvenssi, joka lähettää SDB:n käyttöönottoilmoituksen erikseen. SDB kootaan ja lähetetään vielä yksi ilmoitus
Ongelma on korjattu vain versiossa 8.4(2c).

 
SDB = Zoneset Shared Database eli vyöhykejoukon jaettu tietokanta.

Affected Products

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Products

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6
Article Properties
Article Number: 000181952
Article Type: Solution
Last Modified: 19 Aug 2021
Version:  4
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.