Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

PowerStore : Article général sur les redémarrages inattendus du nœud

Summary: Afin d’identifier pleinement la cause d’un redémarrage ou de fournir une analyse complète des causes premières (RCA), divers journaux sont nécessaires. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Le code d’erreur ou d’événement le plus probable pour ce problème est le suivant : 0x00304404
Description : Le nœud a été physiquement retiré ou arrêté.

Exemple de PowerStore Manager :

SLN322081_en_US__1image(18728)

  ATTENTION : Un redémarrage du nœud peut déclencher d’autres alertes secondaires ou des appels à distance, tels que :
Remarque : La plupart des redémarrages de nœuds sont corrigés en effectuant une mise à jour vers la dernière version de PowerStoreOS. Reportez-vous à la section 1. de PowerStore : Hub d’informations - documentation et vidéos produit .

Cause

Un nœud PowerStore peut redémarrer de manière inattendue pour diverses raisons.
Chaque redémarrage inattendu doit faire l’objet d’une investigation séparée.
Reportez-vous à la section Informations supplémentaires ci-dessous pour plus d’informations sur les éléments nécessaires à cette investigation.

Resolution

Il existe quelques options pour rechercher des redémarrages inattendus des nœuds.
 

Vérification des alertes et des événements à partir de PowerStore Manager (interface graphique utilisateur)

Vérifiez les événements et les alertes qui peuvent indiquer un redémarrage inattendu du nœud :
  • Dans PowerStore Manager, vérifiez la section Surveillance et examinez les détails sous les onglets ALERTES et ÉVÉNEMENTS .
  • Recherchez les horodatages, codes d’erreur ou d’événement, messages, et ainsi de suite. Afin de rendre vos recherches plus claires, utilisez les options de filtre dans les onglets ALERTES et ÉVÉNEMENTS :
SLN322081_en_US__5image(18730)
 

Recherche de fichiers de vidage

Vérifiez qu’il existe des fichiers de vidage système datant du moment où les erreurs se sont produites.

Connectez-vous au cluster via ssh et exécutez svc_dc list_dumps
Vous pouvez également essayer de trouver des fichiers de vidage à partir de PowerStore Manager. Pour plus détails, consultez PowerStore : Comment générer et collecter différents journaux à partir de PowerStore.

Pour vous connecter aux nœuds via ssh, recherchez l’adresse IP du cluster ou du nœud dans PowerStore Manager sous Paramètres > Adresses IP réseau. Connectez-vous avec votre client ssh préféré à l’aide du compte d’utilisateur de maintenance et du mot de passe de l’utilisateur de maintenance respectif (défini lors de la configuration de votre système).  

 

Vérification du temps d’activité sur les deux nœuds

Exécutez la commande temps d’activité sur les deux nœuds. Cela vous indiquera la durée pendant laquelle le nœud était opérationnel et vous aidera à confirmer les redémarrages possibles.
Cela est également utile, car certains redémarrages inattendus peuvent ne pas produire de fichier de vidage.

 

Autres indicateurs

Un écart dans les graphiques de performances dans PowerStore Manager peut également indiquer un redémarrage du nœud. Ces informations ne doivent être utilisées qu’à titre indicatif, et vous devez confirmer avec d’autres preuves comme suggéré ci-dessus. Les graphiques de performances sont disponibles à partir de Tableau de bord > PERFORMANCE, ou Matériel > Appliance X > Performance.

Additional Information

Quels sont les éléments nécessaires à une analyse des causes premières (RCA) ?

  • Documents de support de toutes les appliances du cluster. Ces éléments doivent être collectés le plus près possible du redémarrage.
  • Fichier de vidage
Voir PowerStore : Comment générer et collecter différents journaux à partir de PowerStore

Affected Products

PowerStore
Article Properties
Article Number: 000130141
Article Type: Solution
Last Modified: 16 Aug 2023
Version:  14
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.