Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

switch Connectrix B-Series: Difetti FOS-849642 & FOS-847091 - Switch e director Gen 7 potrebbero riscontrare una condizione di errore che causa errori CRC, porte guaste o causa un riavvio che causa interruzioni

Summary: Director e switch Gen 7 (X7-8, X7-4, 7730 e 7720) che eseguono qualsiasi versione di Fabric OS (FOS) v9.1.x prima di v9.1.1c o in esecuzione su FOS v9.2.0 potrebbe riscontrare un errore che causa errori CRC, porte guaste o causa un in risposta alla grave congestione e all'attivazione del comportamento di gestione della sottoscrizione in eccesso del Funzione Traffic Optimizer Difetti FOS-849642 & FOS-847091 Questi due difetti verranno corretti in FOS v9.1.1c e v9.2.0a. In attesa di questa qualifica, i clienti interessati possono scegliere di implementare la soluzione alternativa. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Prodotti interessati
Brocade X7-8, X7-4, 7730 e 7720 con FOS v9.1.x o FOS v9.2.0
corretti nelle versioni
Brocade FOS v9.1.1c, v9.2.0a e versioni

successive Sono a rischio solo i prodotti Gen 7.
I director Gen 7 (X7-8 e X7-4) con una porta blade FC64-48 e/o FC32-X7-48 installata sono a rischio di riscontrare errori di overflow e "verifica". I blade delle porte FC32-64 e FC32-48 installati nei director Gen 7 non sono a rischio di riscontrare alcun guasto.
Gli switch Gen 7 (G730 e G720) sono solo a rischio di errore di sovraccarico del buffer. Questi switch non sono esposti né sono a rischio di riscontrare la condizione
di errore "verify".Per essere ulteriormente a rischio, la fabric deve subire una grave congestione con conseguente gestione della sottoscrizione in eccesso da parte di Traffic
Optimizer. Se viene rilevato questo livello di risposta, viene visualizzato il seguente messaggio RASlog:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Flows destinati al dispositivo dev02 sono stati spostati in PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, riga: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
L'azione di gestione della sottoscrizione in eccesso da Traffic Optimizer esiste solo nel firmware FOS v9.1.x. I prodotti
Gen 7 in esecuzione su FOS v9.0.x non sono a rischio di nessuna delle condizioni di errore.


Condizioni
di rischio di errore di sovraccarico del bufferAffinché si verifichi la condizione di sovraccarico del buffer, oltre a richiedere un periodo di grave congestione, anche le porte F sul director o sullo switch Gen 7
devono essere state configurate dal valore predefinito a un numero maggiore di buffer. FOS assegnerà
al massimo 28 buffer per impostazione predefinita.
Qualsiasi director o switch Gen 7 con il numero massimo di buffer F-Port aumentato oltre i valori predefiniti utilizzati da
FOS è potenzialmente a rischio e qualsiasi director X7-8 o X7-4 che in precedenza eseguiva FOS v9.0.x potrebbe essere a rischio di riscontrare
errori di "verifica". In entrambi i casi, Traffic Optimizer deve anche tentare di gestire il routing dei frame in risposta a
un evento di sottoscrizione in eccesso causato durante un periodo di grave congestione.

Per determinare i director e gli switch che potrebbero essere a rischio, utilizzare il comando "portbuffershow" per visualizzare l'utilizzo
image.png
del buffer Se il totale di tutto l'utilizzo del buffer per le porte sullo stesso ASIC/chip che sono anche raggruppati insieme aggiunge fino a un valore superiore a 256 buffer, lo switch Gen 7 è considerato a rischio per riscontrare un sovraccarico del buffer in caso di grave evento di congestione che richiede una gestione della sottoscrizione in eccesso da Traffic Optimizer. L'errore non verrà riscontrato in ogni evento di gestione della sottoscrizione in eccesso, in quanto il numero di buffer gestiti al momento dell'evento deve superare i 256 mentre Traffic Optimizer gestisce la sottoscrizione in eccesso, ma la configurazione per gestire potenzialmente più di 256 buffer metterà a rischio lo switch.
Nell'output di esempio mostrato in precedenza, se tutte le 8 porte F si trovano in una zona insieme, lo switch è a rischio di riscontrare un sovraccarico del buffer dei frame
mentre Traffic Optimizer gestisce una condizione di sottoscrizione in eccesso, poiché il conteggio totale di utilizzo del buffer in questo esempio è 360.
Tuttavia, nell'esempio seguente, in cui le porte F non sono tutte raggruppate in zone, questo switch non sarebbe a rischio in quanto le due zone (mostrate in verde) totali fino a 232 buffer e 128 buffer, rispettivamente.
image.png
Il numero massimo di porte utilizzate per la gestione della sottoscrizione in eccesso è 8 porte. Se più di 8 porte sono raggruppate insieme dallo stesso ASIC/chip, il totale delle 8 porte con i valori di utilizzo del buffer più alti per determinare il rischio.

NOTA: I director e gli switch gen 7 che non hanno mai modificato il numero di buffer F-Port rispetto all'impostazione predefinita non sono a rischio per riscontrare questo problema di sovraccarico del buffer del frame. Il valore massimo utilizzato come impostazione predefinita per buffer max/reserved è 28 per i prodotti Gen 7; tuttavia, è possibile allocare un numero inferiore di buffer a seconda del tipo di switch e della velocità ottica. I clienti
che non hanno mai aumentato il numero di buffer max/riservati rispetto all'impostazione predefinita non riscontreranno il problema di overflow
del buffer. Anche con 8 porte raggruppate, utilizzando l'allocazione predefinita massima di 28 buffer per porta, il valore totale dell'utilizzo massimo del
buffer è di soli 224 frame.

"Verificare" le condizioni
di rischio dell'erroreOltre al problema di sovraccarico del buffer, i director X7-8 e X7-4 potrebbero anche essere a rischio di "verificare" i messaggi di errore se in questo ordine sono soddisfatte le seguenti condizioni:
  • Director X7-8 o X7-4 in esecuzione in precedenza su FOS v9.0.x
  • Il director viene quindi aggiornato a FOX v9.1.x
  • Il director dispone quindi di porte F che si disconnetteno e accedono alla versione v9.1.x
  • Il director rileva quindi un evento di sottoscrizione in eccesso che richiede la gestione da Traffic Optimizer
  • Il director esegue quindi un failover ha (l'aggiornamento del firmware causa un failover)
  • Il director rileva un altro evento di sottoscrizione in eccesso che richiede la gestione da Traffic Optimizer 
I director X7-8 o X7-4 che soddisfano tutte queste condizioni, nella sequenza specificata, potrebbero essere a rischio di riscontrare errori di "verifica" durante la gestione della sottoscrizione in eccesso da Traffic Optimizer.
  • I director X7-8 o X7-4 che hanno mai eseguito solo il firmware FOS v9.1.x non sono a rischio di riscontrare l'errore di "verifica" in quanto viene utilizzato solo il modello di programmazione v9.1 per tutte le porte. Per essere soggetti a questo problema, i director di 7a generazione devono essere in esecuzione in precedenza con FOS v9.0.x.
  • Anche i director X7-8 o X7-4 con avvio a freddo/riacceso durante l'esecuzione su firmware FOS v9.1.x non sono a rischio per riscontrare l'errore di "verifica" in quanto tutte le porte utilizzeranno la programmazione v9.1 dopo il riavvio

Sintomi
I director e gli switch di 7a generazione che hanno riscontrato un evento di gestione della sottoscrizione in eccesso osserveranno i seguenti
RASlog di Traffic Optimizer:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Flows destinati al dispositivo b1a02 sono stati spostati in PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, riga: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Ulteriori sintomi che potrebbero apparire a causa di questi problemi identificati potrebbero essere:
  • È possibile osservare un numero elevato di errori CRC su un collegamento che non sono stati risolti con la sostituzione di cavi/ottiche
  • I frame possono essere eliminati, il credito su un link può essere perso
  • Le porte potrebbero essere guaste, ASIC potrebbe arrestarsi ed essere guasta
  • Un director può osservare un failover ha imprevisto o anche un riavvio a freddo del director
  • Gli switch potrebbero riscontrare un riavvio a freddo

Cause

La gestione della sottoscrizione in eccesso da parte della funzione Traffic Optimizer in condizioni specifiche potrebbe causare scenari
di errore che influiscono sulla trasmissione dei frame o delle porte gestite. In scenari di grave congestione, questi errori potrebbero anche
influire sulle prestazioni di altri daemon FOS (Fabric OS), attivi sullo switch, con conseguente timeout
del watchdog del software con conseguente failover HA o errore irreversibile dello switch.

I director e switch Gen 7 (X7-8, X7-4, 7730 e 7720) che riscontrano un sovraccarico di buffer dei frame durante il tentativo di
gestire e reinstradare i flussi sottoscritti in risposta a un grave evento di congestione possono causare errori imprevisti. Se
il numero di frame sovraccarica il buffer utilizzato per gestire la gestione della sottoscrizione in eccesso, questi frame in eccesso possono
essere persi durante la gestione di Traffic Optimizer. Questi frame in eccesso possono essere potenzialmente sovrascritti da altri frame che causano
errori CRC dei frame o anche guasti delle porte se le informazioni sull'intestazione vengono sovrascritte. In scenari di grave congestione, la gestione di questi frame di overflow/in eccesso può portare al blocco di altri daemon FOS, con
conseguente timeout del watchdog. Daemon critici che si verificano timeout causano un failover HA o un riavvio dello switch con interruzioni.

Oltre alla gestione dell'overflow dei frame potenziale, i director X7-8 e X7-4 che in precedenza operavano su FOS v9.0.x e successivamente aggiornati a FOS v9.1.x potevano riscontrare errori di verifica dopo il failover ha (inclusi quelli causati dagli aggiornamenti del firmware alle versioni superiori di v9.1.x). Più messaggi di errore di "verifica" verranno osservati durante la gestione della sottoscrizione in eccesso da Traffic Optimizer a causa di un conflitto rilevato nella programmazione delle porte create quando alcune porte, ma non tutte, vengono reimpostate alla versione v9.1.x. Il conflitto tra la programmazione di gestione della congestione sulle porte che non sono mai state reimpostate in v9.0.x e in seguito ha riscontrato la gestione della congestione in v9.1.x sulle porte che sono state reimpostate può apparire dopo un evento di failover HA.

Resolution

Soluzione alternativa
" A rischio" director e switch possono disabilitare l'azione di gestione della sottoscrizione in eccesso di Traffic Optimizer.
Eseguire il seguente comando CLI dall'account di manutenzione per disabilitare il comportamento di azione di gestione della sottoscrizione
in eccesso in Traffic Optimizer
maintenance> serviceexec trafopt più --enableosclassificazione 0
NOTA: Il comando di manutenzione deve essere eseguito su tutti gli switch logici dello chassis.
NOTA: L'impostazione sarà persistente tra failover e cicli

di alimentazioneAzione
correttiva Una soluzione software fornita in FOS v9.1.1c e versioni successive eseguirà la prevenzione di questi guasti. Le stesse soluzioni sono fornite
anche in FOS v9.2.0a e versioni successive di FOS v9.2.x. L'aggiornamento a queste versioni di FOS impedirà un overrun dei frame a causa della
gestione della sottoscrizione in eccesso e impedirà anche errori di "verifica" sui director X7.

Per qualsiasi director o switch Gen 7 (X7-8, X7-4, 7730 e 7720) che esegue ancora una versione di FOS v9.0.x e potrebbe essere "a rischio"
per riscontrare i problemi descritti, si consiglia di attendere il rilascio di FOS v9.1.1c prima dell'aggiornamento.

I director e switch gen 7 che attualmente operano su una versione v9.1.x o v9.2.0 e che sono determinati come a rischio
devono implementare la soluzione alternativa. La disattivazione dell'azione di gestione della sottoscrizione in eccesso di Traffic Optimizer eviterà
che si verifichino errori di overrun del buffer e di "verifica". Dopo l'aggiornamento a v9.1.1c o v9.2.0a, è possibile riattivare l'azione di gestione della sottoscrizione in eccesso
tramite il seguente comando:
Eseguire il seguente comando CLI dall'account di manutenzione per riabilitare il comportamento dell'azione di gestione della sottoscrizione in eccesso in Traffic Optimizer
manutenzione> servizioeseguito trafopt più --enableosclassificazione 1
NOTA: Il comando di manutenzione deve essere eseguito su tutti gli switch logici dello chassis.

Qualsiasi director o switch Gen 7 che abbia già riscontrato l'errore "buffer overflow" dovrà eseguire un riavvio
a freddo per eseguire il ripristino completo dalla condizione di errore:
Amministrazione: Spegnere lo slot/accendere gli switch blade
delle porte interessati: Riavviare lo switch (riavvio a freddo)
Opzione 1: Eseguire l'azione di riavvio mostrata in precedenza, quindi implementare la soluzione alternativa per disabilitare l'azione di gestione della sottoscrizione in eccesso dall'interno dell'opzione 2 di ottimizzazione
del traffico: Eseguire l'aggiornamento a una versione di FOS con la soluzione, quindi eseguire l'azione di riavvio mostrata in precedenza.

L'aggiornamento a una versione di FOS con la soluzione fornita impedirà l'errore di "sovraccarico del buffer", ma
una volta rilevata la condizione di errore, solo un riavvio a freddo dell'ASIC risolverà la condizione di errore.
L'aggiornamento a una versione di FOS con la soluzione fornita impedirà e ripristi automaticamente dalla condizione di errore
di "verifica" senza ulteriori azioni.

Dopo l'aggiornamento a una versione di FOS che contiene la soluzione, verrà eseguito un controllo della memoria interna per determinare se il director o lo switch ha riscontrato in precedenza l'errore e richiede un riavvio per risolvere la condizione di errore.
Viene visualizzato il seguente RASlog in caso di rilevamento della condizione di errore dopo l'aggiornamento di FOS a una versione con la soluzione:
06/06/2023-17:07:50 (GMT), [C5-1057], 5, SLOT 2 | CHASSIS, CRITICO, Switch_3,
S10, C0: Il chip ASIC hardware è in uno stato incoerente = 0x1002.
Se si osserva il RASlog precedente dopo l'aggiornamento di FOS, il director o lo switch ha in precedenza riscontrato l'errore "buffer
overflow" prima dell'aggiornamento e dovrà eseguire un riavvio a freddo per eseguire il ripristino completo dalla condizione di errore:
Amministrazione: Spegnere lo slot/accendere gli switch blade
delle porte interessati: Riavviare lo switch (riavvio a freddo)

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution