Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Commutateur Connectrix B-Series : Défauts FOS-849642 & FOS-847091 - Les directeurs et les commutateurs de 7e génération peuvent rencontrer une condition de défaillance qui provoque des erreurs CRC, des défaillances de ports ou un redémarrage perturbateur

Summary: Directeurs et commutateurs Gen 7 (X7-8, X7-4, 7730 et 7720) exécutant n’importe quelle version de Fabric OS (FOS) v9.1.x avant v9.1.1c ou l’exécution sur FOS v9.2.0 peut rencontrer une condition d’échec qui provoque des erreurs CRC, des défaillances de ports ou provoque une redémarrage perturbateur en réponse à une congestion grave et à l’activation du comportement de gestion du surabonnement du Fonction d’optimisation du trafic Défauts FOS-849642 et FOS-847091 Ces deux défauts seront corrigés dans FOS v9.1.1c et v9.2.0a. En attendant cette qualification, les clients concernés peuvent choisir d’implémenter la solution de contournement. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Produits concernés
Brocade X7-8, X7-4, 7730 et 7720 exécutant FOS v9.1.x ou FOS v9.2.0
Corrigé dans les versionsBrocade FOS v9.1.1c, v9.2.0a et versions

supérieures Seuls
les produits Gen 7 sont en danger.
Les directeurs De 7e génération (X7-8 et X7-4) dotés d’une lame de port FC64-48 et/ou FC32-X7-48 risquent de rencontrer des erreurs de dépassement et de vérification. Les lames de port FC32-64 et FC32-48 installées dans les directeurs Gen 7 ne risquent pas de rencontrer une défaillance.
Les commutateurs Gen 7 (G730 et G720) risquent uniquement de rencontrer une défaillance de dépassement de capacité de la mémoire tampon. Ces commutateurs ne sont pas exposés à et ne risquent pas de rencontrer la condition d’échec d’erreur « verify ».
Pour être encore plus exposé, le fabric doit subir une congestion importante, ce qui entraîne une gestion du surabonnement par Traffic
Optimizer. Le message RASlog suivant s’affiche si ce niveau de réponse a déjà été atteint :
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, flux destinés au périphérique dev02 ont été déplacés vers PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, ligne : 1470, comp :cfsd, ltime :2023/05/17-06 :15 :33 :923058
L’action de gestion du surabonnement par Traffic Optimizer n’existe que dans le firmware FOS v9.1.x. Les produits
Gen 7 s’exécutant sur FOS v9.0.x ne sont pas exposés à l’une ou l’autre des conditions de défaillance.


Conditions
de risque d’échec de dépassement de la mémoire tamponPour que la condition de dépassement de capacité de la mémoire tampon se produise, en plus de nécessiter une période de congestion grave, les ports F du directeur ou du commutateur Gen 7
doivent également avoir été configurés à partir de la valeur par défaut vers un plus grand nombre de tampons. FOS
attribue au plus 28 tampons par défaut.
Tout directeur ou commutateur De 7e génération dont le nombre maximal de tampons F-Port a augmenté au-dessus des valeurs par défaut utilisées par
FOS est potentiellement exposé à des risques, et tout directeur X7-8 ou X7-4 qui exécutait auparavant FOS v9.0.x pouvait
rencontrer des erreurs de « vérification ». Dans les deux cas, Traffic Optimizer doit également tenter de gérer le routage des trames en réponse à
un événement de surabonnement causé par une période de congestion importante.

Pour déterminer les directeurs et les commutateurs susceptibles d’être compromis, utilisez la commande « portbuffershow » pour afficher l’utilisation de la
image.png
mémoire tampon Si le total de l’utilisation de la mémoire tampon pour les ports sur le même ASIC/puce qui sont également zonés ensemble ajoute une valeur supérieure à 256 tampons, alors le commutateur Gen 7 est considéré comme susceptible de subir une saturation de la mémoire tampon si un événement de congestion grave nécessite une gestion de surabonnement de Traffic Optimizer. L’échec ne se produit pas sur chaque événement de gestion du surabonnement, car le nombre de tampons gérés au moment de l’événement doit dépasser 256, tandis que Traffic Optimizer gère le surabonnement, mais être configuré pour gérer potentiellement plus de 256 tampons risque de mettre le commutateur en péril.
Dans l’exemple de sortie ci-dessus, si les 8 ports F se trouvent dans une zone, le commutateur risque de rencontrer un
dépassement de capacité de la mémoire tampon tandis que Traffic Optimizer gère une condition de surabonnement, car le nombre total d’utilisations de la mémoire tampon dans cet exemple est de 360.
Toutefois, dans l’exemple suivant où les F-Ports ne sont pas tous zonées ensemble, ce commutateur ne serait pas en danger, car les deux zones (affichées en vert) totalisent respectivement jusqu’à 232 tampons et 128 tampons.
image.png
Le nombre maximal de ports utilisés pour la gestion du surabonnement est de 8 ports. Si plus de 8 ports sont zonées ensemble à partir du même ASIC/puce, totaliser les 8 ports avec les valeurs d’utilisation de la mémoire tampon les plus élevées pour déterminer le risque.

NOTE: Les directeurs et les commutateurs de 7e génération qui n’ont jamais eu leur nombre de tampons F-Port modifiés par rapport à la valeur par défaut ne risquent pas de rencontrer ce problème de dépassement de capacité de la mémoire tampon de trame. La valeur maximale utilisée comme paramètre par défaut pour les tampons max./réservés est de 28 pour les produits Gen 7. Toutefois, moins de tampons peuvent être alloués en fonction du type de commutateur et de la vitesse optique. Les clients
qui n’ont jamais augmenté leur nombre de tampons max./réservés par défaut ne rencontreront pas le problème de dépassement de capacité
de la mémoire tampon. Même avec 8 ports zonées ensemble, avec l’allocation par défaut maximale de 28 tampons par port, la valeur totale de l’utilisation maximale de
la mémoire tampon n’est que de 224 trames.

Conditions de risque
de défaillance « Vérifier »Outre le problème de dépassement de capacité de la mémoire tampon, les directeurs X7-8 et X7-4 risquent également de « vérifier » les messages d’erreur si les conditions suivantes sont remplies dans cet ordre :
  • Directeur X7-8 ou X7-4 précédemment exécuté sur FOS v9.0.x
  • Le directeur est ensuite mis à niveau vers FOX v9.1.x
  • Le directeur dispose ensuite de ports F qui se déconnectent et se connectent à la version v9.1.x
  • Le directeur rencontre ensuite un événement de surabonnement qui nécessite une gestion à partir de Traffic Optimizer
  • Le directeur effectue ensuite un basculement HA (la mise à niveau du micrologiciel entraîne un basculement)
  • Le directeur rencontre un autre événement de surabonnement qui nécessite une gestion à partir de Traffic Optimizer 
Les directeurs X7-8 ou X7-4 qui répondent à toutes ces conditions, dans la séquence spécifiée, risquent de rencontrer des erreurs de « vérification » lors de la gestion du surabonnement à partir de Traffic Optimizer.
  • Les directeurs X7-8 ou X7-4 qui n’ont jamais été exécutés sur le firmware FOS v9.1.x ne risquent pas de rencontrer l’erreur de « vérification », car seul le modèle de programmation v9.1 est utilisé pour tous les ports. Les directeurs gen 7 doivent avoir été précédemment exécutés avec FOS v9.0.x afin d’être sensibles à ce problème.
  • Les directeurs X7-8 ou X7-4 qui ont été redémarrés à froid/redémarrés lors de l’exécution sur le firmware FOS v9.1.x ne risquent pas non plus de rencontrer l’erreur de « vérification », car tous les ports utiliseront la programmation v9.1 après le redémarrage.

Symptômes
Les directeurs et commutateurs gen 7 qui ont rencontré un événement de gestion de surabonnement observeront le journal RASlog de l’optimiseur de trafic suivant
 :
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, flux destinés au périphérique b1a02 ont été déplacés vers PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, ligne : 1470, comp :cfsd, ltime :2023/05/17-06 :15 :33 :923058
Les symptômes supplémentaires qui peuvent apparaître en raison de ces problèmes identifiés peuvent être les suivants :
  • Il est possible d’observer un grand nombre d’erreurs CRC sur une liaison qui ne sont pas corrigées avec le remplacement des câbles/optiques
  • Les trames peuvent être ignorées, le crédit sur une liaison peut être perdu
  • Les ports peuvent être défaillants, asic peut s’arrêter et être défaillants
  • Un directeur peut observer un basculement HA inattendu ou même un redémarrage à froid du directeur
  • Les commutateurs peuvent observer un redémarrage à froid

Cause

La gestion des surabonnements par la fonction Traffic Optimizer dans des conditions spécifiques peut entraîner des scénarios
de défaillance ayant un impact sur la transmission des trames ou des ports gérés. Dans les scénarios de congestion grave, ces défaillances peuvent également
avoir un impact sur les performances d’autres processus DE FABRIC OS (FOS), actifs sur le commutateur, ce qui entraîne des expirations
du délai de surveillance du logiciel, entraînant un basculement HA ou une panique du commutateur.

Les directeurs et commutateurs de 7e génération (X7-8, X7-4, 7730 et 7720) qui rencontrent un dépassement de tampons de trame lors de la tentative
de gestion et de routage des flux surabonnés en réponse à un événement de congestion grave peuvent provoquer des erreurs inattendues. Si
le nombre de trames dépasse le tampon utilisé pour gérer la gestion du surabonnement, ces trames excédentaires peuvent
être manquées lors de la gestion de l’optimiseur du trafic. Ces trames excédentaires peuvent potentiellement être remplacées par d’autres trames entraînant des
erreurs CRC de trame ou même des défaillances de port si les informations d’en-tête sont écrasées. Dans les scénarios de congestion grave, la gestion de ces dépassements/trames excédentaires peut entraîner le blocage d’autres processus FOS, ce qui peut entraîner
des délais d’expiration de la surveillance. Les processus critiques indiquant que le délai d’expiration entraîne un basculement HA ou un redémarrage perturbateur du commutateur.

En plus de la gestion potentielle des dépassements de trame, les directeurs X7-8 et X7-4 qui fonctionnaient auparavant sur FOS v9.0.x, puis mis à niveau vers FOS v9.1.x pouvaient rencontrer des erreurs de vérification après des basculements HA (y compris ceux causés par les mises à niveau du micrologiciel vers des versions supérieures de v9.1.x). Plusieurs messages d’erreur de « vérification » sont observés lors de la gestion du surabonnement par l’optimiseur de trafic en raison d’un conflit détecté dans la programmation des ports créés lorsque certains ports, mais pas tous, sont réinitialisés sur v9.1.x. Le conflit entre la programmation de gestion de la congestion sur les ports qui n’ont jamais été réinitialisés alors qu’ils étaient à la version v9.0.x, puis a ensuite rencontré une gestion de la congestion alors qu’à la version v9.1.x sur les ports qui ont été réinitialisés, peut s’afficher après un événement de basculement HA.

Resolution

Work-Around
» À risque » les directeurs et les commutateurs peuvent désactiver l’action de gestion du surabonnement de Traffic Optimizer.
Exécutez la commande CLI suivante à partir du compte de maintenance pour désactiver le comportement de l’action de gestion du surabonnement
dans Traffic Optimizer
maintenance> serviceexeccompatdebug --enableosclassification 0
Remarque : La commande de maintenance doit être exécutée sur tous les commutateurs logiques du châssis.
NOTE: Le paramètre est persistant sur les basculements et les cycles

d’alimentationAction
corrective Une solution logicielle fournie dans FOS v9.1.1c et versions ultérieures permet d’éviter ces défaillances. Les mêmes solutions sont également fournies
dans FOS v9.2.0a et versions supérieures de FOS v9.2.x. La mise à niveau vers ces versions de FOS permet d’éviter un dépassement des trames en raison de
la gestion du surabonnement et empêche également les erreurs de « vérification » sur les directeurs X7.

Pour tout directeur ou commutateur Gen 7 (X7-8, X7-4, 7730 et 7720) qui exécute toujours une version de FOS v9.0.x et peut être « à risque »
pour rencontrer les problèmes décrits, il est recommandé d’attendre la version de FOS v9.1.1c avant la mise à niveau.

Les directeurs et les commutateurs de 7e génération qui fonctionnent actuellement sur des versions v9.1.x ou v9.2.0, et qui sont jugés à risque
, doivent implémenter les solutions de contournement. La désactivation de l’action de gestion du surabonnement de l’optimiseur du trafic empêche
le dépassement de la mémoire tampon et la « vérification » des erreurs. Après la mise à niveau vers v9.1.1c ou v9.2.0a, l’action de gestion du surabonnement
peut être réactivée à l’aide de la commande suivante :
Exécutez la commande CLI suivante à partir du compte de maintenance pour réactiver le comportement de l’action de gestion du surabonnement dans Traffic Optimizer.
maintenance> serviceexeccompatdebug --enableosclassification 1
Remarque : La commande de maintenance doit être exécutée sur tous les commutateurs logiques du châssis.

Tout directeur ou commutateur Gen 7 qui a déjà rencontré l’échec de « dépassement de capacité de la mémoire tampon » devra effectuer un redémarrage
à froid pour effectuer une restauration complète en cas de défaillance :
Administration: Mise hors tension/sur les commutateurs lames
de port concernés : Redémarrez le commutateur (redémarrage à froid).
Option 1 : Effectuez l’action de redémarrage indiquée ci-dessus, puis implémentez le contournement pour désactiver l’action de gestion du surabonnement dans l’option Traffic Optimizer
2 : Effectuez une mise à niveau vers une version de FOS avec la solution, puis effectuez l’action de redémarrage illustrée ci-dessus.

La mise à niveau vers une version de FOS avec la solution fournie empêche l’échec de « dépassement de capacité de la mémoire tampon », mais
une fois la condition défaillante rencontrée, seul un redémarrage à froid de l’ASIC résout la condition d’échec.
La mise à niveau vers une version de FOS avec la solution fournie empêchera et récupérera automatiquement de la condition d’erreur
« verify » sans aucune autre action.

Après la mise à niveau vers une version de FOS qui contient la solution, une vérification de la mémoire interne est effectuée pour déterminer si le directeur ou le commutateur a déjà rencontré l’échec et nécessite un redémarrage pour récupérer de la condition d’erreur.
Le journal RAS suivant s’affiche si la condition d’échec est détectée après la mise à niveau de FOS vers une version avec la solution :
06/06/2023-17 :07 :50 (GMT), [C5-1057], 5, LOGEMENT 2 | CHÂSSIS, CRITIQUE, Switch_3,
S10, C0 : La puce HW ASIC est dans un état incohérent = 0x1002.
Si le journal RASlog ci-dessus est observé après la mise à niveau de FOS, le directeur ou le commutateur a précédemment rencontré l’échec de « dépassement de capacité de la mémoire tampon
» avant la mise à niveau et devra effectuer un redémarrage à froid pour effectuer une restauration complète en cas de défaillance :
Administration: Mise hors tension/sur les commutateurs lames
de port concernés : Redémarrez le commutateur (redémarrage à froid).

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution