Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Přepínač Cisco MDS: Hostitelé ztrácí při aktivaci zón cestu k portům frontendu (FE) zařízení VPLEX

Summary: Během aktivace zón jsou všechny adaptéry HBA s přiřazenou zónou frontend portu zařízení VPLEX odhlášeny a ztratí cestu. Hostitelé ESX mohou zamrznout a k obnovení požadovat restart. [Scott - does this only impact ESX hosts? The summary reads "All HBAs zoned to a VPLEX" do we want to limit this to only ESX hosts, or re-word to say "Hosts may hang and required a reboot to recover?] ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Hostitelé ztrácí cesty.
[POZNÁMKA – Scott also see note in the summary]

Hostitel ESX zamrzne a k obnovení vyžaduje restartování. [ Scott is it just ESX hosts that can become hung? The summary states "all HBAs zoned to VPLEX"]

V protokolu ESXi „vmkernel“ je uvedeno:

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


V protokolech firmwaru VPLEX je uvedeno:
event fc/4:  "This port has discovered the departure of the indicated port from the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Scott - back to the issue of "all HBAs zoned to VPLEX" if this cisco issue impacts all HBAs zoned to VPLEX should we be showing reports of other hosts departing in the fw logs? Do we see other hosts departing same as the esx host shown above?]

event fc/3: "This port has discovered the arrival of the indicated port on the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Scott: do we have this data for other HBAs seen to also have arrived ? ]


Změna:
Aktivace zóny.
Porty HBA a porty frontendu zařízení VPLEX se nepodílejí na změnách zón.
[Scott – this last sentence does not make sense, the issue, as I understand it, is when there is a ZoneSet activation on a cisco switch all HBAs and VPLEX FE ports 'are' involved. also what Cisco Switch code level(s) does this impact?]

Cause

Zařízení VPLEX každých 90 sekund provádí zjišťování topologie Fabric na všech portech Fibre Channel (frontend, backend i FC-WANCOM) pomocí příkazu názvového serveru „Get all next“ (GA_NXT). K tomu dochází mimo příjem RSCN z přepínače nebo PLOGI ze zónovaného adaptéru HBA.

Pokud zařízení VPLEX provádí zjišťování topologie Fabric na portu frontendu (FE), zatímco probíhá aktivace/potvrzení, existuje kvůli chybě Cisco CSCvw75655 malá šance, že zařízení VPLEX bude vrácena pouze vlastní adresa Fibre Channel (FCID). Zařízení bude poté předpokládat, že žádný z adaptérů HBA, které jsou k němu přihlášeny, již není připojen k topologii Fabric, a odešle na každý adaptér HBA, kterému je přiřazena jeho zóna, příkaz k odhlášení (PLOGO). [Scott – are the VPLEX and/or switch logs that show this action taking place, the PLOGO being sent, if this can be seen on both products can we include samples of this and from which logs this is seen?]

Zařízení VPLEX zaprotokoluje události fc/4 pro každý adaptér HBA, který odhlásí, a události fc/3 při následujícím 90sekundovém zjišťování topologie Fabric, když obdrží správné informace z názvového serveru přepínače.

Způsob, jakým adaptér HBA toto odhlášení zpracovává, závisí na jeho ovladači/firmwaru. Hostitel ESX v tomto příkladu zamrzl a vyžadoval restart. [Scott – do we have data from the logs of other hosts being impacted by this event? if so can we also list some so it does not look like only ESX hosts are impacted?]

POZNÁMKA:
Pravidelné zjišťování topologie Fabric se provádí, aby byla zajištěna aktualizace údajů o topologii Fabric zařízení VPLEX, protože existuje možnost, že ne všechny RSCN dosáhnou zařízení VPLEX z topologie Fabric.

Resolution

Zástupné řešení:

Na přepínači Cisco zakažte následujícím způsobem funkci sdílené databáze (DB) názvového serveru / serveru zón:
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


POZNÁMKA: Funkce sdílení databáze pomocí sady zón je efektivní pouze tam, kde názvový server a server zón sdílejí informace. Deaktivace funkce nebude mít žádný negativní dopad na prostředí.

Společnost Cisco potvrdila, že změna je pouze místní, nikoli globální. Tento příkaz je třeba provést na každém přepínači, ke kterému je připojeno zařízení VPLEX. [Scott - is there a Cisco KB that talks to this issue that we can reference in this KBA?]

Oprava:

NX-OS 8.4(2c). Tato verze zatím není u společnosti Dell EMC obecně dostupná.
[Scott - we cannot list a fix that is not yet available from Dell EMC, once available repost this KBA for review and remove the sentence "This version has not been GA by Dell EMC"]

Additional Information

Produkty (1)
Software Cisco MDS 9000 NX-OS a SAN-OS

Známé dotčené verze
8.3(2)

Rozpoznávání topologie fabric zařízení VPLEX

Příklad:
Hostiteli 1, hostiteli 2 a hostiteli 3 je přiřazena zóna jediného portu VPLEX FE.

Port VPLEX FE: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020 
Host 3: FCID 0x340040 

Working... [Scott - what is this? this taken/copied from info? If so we can remove the "working..." info]

 

  1. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) „0xffffff“ (nejvyšší).
  2. Názvový server odpoví s podrobnostmi o portu VPLEX FE (nejnižší).
  3. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) portu VPLEX FE.
  4. Názvový server odpoví s podrobnostmi o hostiteli 1.
  5. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) hostitele 1.
  6. Názvový server odpoví s podrobnostmi o hostiteli 2.
  7. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) hostitele 2.
  8. Názvový server odpoví s podrobnostmi o hostiteli 3.
  9. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) hostitele 3.
  10. Názvový server odpoví s podrobnostmi o portu VPLEX FE.
  11. Zařízení VPLEX se zde zastaví, protože obdrželo adresu Fibre Channel (FCID) sebe sama, a ta už byla zjištěna (znovu přeškrtnutá).

Chyba Cisco CSCvw75655.

 

  1. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) „0xffffff“ (nejvyšší).
  2. Názvový server odpoví s podrobnostmi o portu VPLEX FE (nejnižší).
  3. Zařízení VPLEX odešle příkaz „Get all next“ na názvový server s adresou fibre channel (FCID) portu VPLEX FE.
  4. Názvový server odpoví s podrobnostmi o portu VPLEX FE.
  5. Zařízení VPLEX se zde zastaví, protože obdrželo adresu Fibre Channel (FCID) sebe sama, a ta už byla zjištěna (znovu přeškrtnutá).

Další podrobnosti týkající se opravy chyby CSCvw75655, která byla přidána do systému NX-OS 8.4(2c).
 
Připomenutí příčiny této chyby:
 
K problému dochází, když cílové zařízení vydá příkaz FCNS GA_NXT a obdrží pouze své vlastní FCID, což znamená, že nemá přiřazenou zónu žádného dalšího zařízení. Některá cílová zařízení vydávají tyto příkazy GA_NXT pravidelně. A protože je neřídí RSCN ani jiný stimul, jsou k tomuto problému náchylné.
Příčinou je to, že když probíhá aktivace/potvrzení sady zón, přepínač FCNS stihne v rámci krátkého časového okna získat v odpovědi na příkaz GA_NXT pouze FCID vydavatele a žádné další z těch, pomocí nichž je mu přiřazena zóna. To je důsledek funkce sdílení databáze pomocí sady zón, která byla zavedena do systému Cisco MDS NX-OS 7.3(0)D1(1). 

 
Následuje popis opravy od společnosti Cisco:

V rámci aktivace se spustí deaktivace a dojde k vymazání databáze SDB. Databáze SDB po vymazání odešle všem odběratelům oznámení. K tomu nyní nedojde. Byla také přidána nová sekvence, která odešle oznámení o potvrzení databáze SDB samostatně. Je přiřazena zóna za účelem vytvoření databáze SDB a odešle se jedno závěrečné upozornění.
Oprava je součástí pouze verze 8.4(2c).

 
SDB = databáze sdílená pomocí sady zón

Article Properties


Affected Product

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Product

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6

Last Published Date

19 Aug 2021

Version

4

Article Type

Solution