Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

Gestion des dommages (blocs défectueux) sur les disques virtuels pour les serveurs PowerEdge

Summary: étapes de dépannage pour les blocs défectueux (perforations) sur les disques durs des serveurs PowerEdge équipés de contrôleurs PERC. Les informations suivantes peuvent vous aider à rétablir un disque virtuel affecté à un état optimal, en particulier lorsqu’aucune sauvegarde n’est possible. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

-

Cause

-

Resolution

Cet article présente les étapes de dépannage en cas de blocs défectueux (perforations) sur les disques durs des serveurs PowerEdge équipés de contrôleurs PERC. Les informations suivantes peuvent vous aider à rétablir un disque virtuel affecté à un état optimal, en particulier lorsqu’aucune sauvegarde n’est possible.



Sommaire :

  1. Description des pannes

  2. Cause

  3. Étapes de résolution du problème

  4. Informations supplémentaires


 



1. Description des pannes

 

Panne n° 1 :


OpenManage Server Administrator (OMSA) affiche une croix rouge devant un disque virtuel (Figure 1).  

SLN111146_en_US__11343098652871.1
Figure 1 : Disque virtuel avec une croix rouge dans la colonne Status (exemple H800)

SLN111146_en_US__2icon Remarque : Dell OpenManage Server Administrator (OMSA) fournit une solution de gestion de systèmes un-à-un complète. OMSA peut être utilisé de deux façons :
- Intégrée : interface graphique (GUI) de type navigateur Web.
- Interface de ligne de commande (CLI) : par l’intermédiaire du système d’exploitation


 


Panne n° 2 :


Le journal système de Windows affiche des erreurs de bloc défectueux (Figure 2).  

SLN111146_en_US__31343098674763.2 
Figure 2 : Erreur de bloc défectueux dans le journal système Windows
 


 


Panne n° 3 :


Le journal du contrôleur RAID (TTYLOG) affiche des erreurs telles que :  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Avertissement : le journal du contrôleur (TTYLOG) peut ne présenter aucune erreur.

 



2. Cause :


Les systèmes RAID ne sont pas à l’abri des erreurs de données.  Le contrôleur RAID et le micrologiciel du disque dur contiennent des fonctions permettant de détecter et de corriger de nombreux types d’erreurs de données, avant qu’elles ne soient écrites sur un disque ou une matrice.  Utiliser un firmware obsolète peut entraîner l’écriture de données incorrectes sur un disque ou une baie, car le firmware ne dispose pas des fonctionnalités de gestion et de correction des erreurs disponibles dans les dernières versions.
Les erreurs de données peuvent également être provoquées par des blocs physiques défectueux.  Par exemple, une erreur peut se produire lorsque la tête de lecture/écriture impacte le plateau tournant (cela s’appelle également une « panne de la tête »).  Les blocs peuvent également devenir défectueux avec le temps, à cause de la dégradation de la capacité du plateau à stocker magnétiquement des bits dans un emplacement spécifique.  Souvent, les blocs devenus défectueux à cause de la dégradation du plateau peuvent être lus correctement.  Un bloc ainsi endommagé peut n’être détecté que par intermittence ou en effectuant des diagnostics étendus sur les disques.  

Un bloc, également appelé adressage de blocs logiques (LBA), peut également devenir défectueux à cause d’erreurs de données logiques.  Cela se produit lorsque les données sont écrites de manière incorrecte sur un disque, même si l’opération d’écriture est signalée comme réussie.  En outre, des données exactes stockées sur un disque peuvent être modifiées par inadvertance.  Une « inversion de bit » peut par exemple se produire lorsque la tête de lecture/écriture passe sur ou écrit sur un emplacement à proximité et provoque un changement de valeur des données, qui passent de 0 à 1 et vice versa.  Dans cette situation, la « cohérence » des données est altérée.  La valeur des données sur un bloc spécifique est différente de celle des données d’origine et peut ne pas correspondre à la somme de contrôle des données.  Le LBA physique fonctionne et les opérations d’écriture peuvent s’effectuer sans problème, mais il contient des données incorrectes et peut être interprété comme un bloc défectueux.

Pour plus d’informations, lisez notre article Doubles défaillances dans les systèmes RAID.
 



3. Étapes de résolution du problème :
 

SLN111146_en_US__2icon Remarque : les données actuelles présentes sur le disque virtuel sont corrompues et doivent être supprimées.
  1. Créez une sauvegarde des données validée au niveau des fichiers.
     

    • Une sauvegarde basée sur des blocs transfèrerait simplement le problème.
    • Une sauvegarde au niveau des fichiers indique les fichiers corrompus (ces fichiers ne doivent pas être sauvegardés).
    • Il n’y a jamais de garantie à 100 % que vous conserverez toutes les données si une bande endommagée existe déjà.
     

     

  2. Assurez-vous que tous les disques défectueux affichant des pannes prédictives sont remplacés.
     

  3. Supprimez et recréez le disque virtuel.
     

    • Cette étape permet de supprimer toutes les données du disque virtuel.
    • Supprimez la matrice.
    • Recréez la matrice comme vous le souhaitez.
     

     

  4. Effectuez une initialisation complète du disque virtuel.
     

    • Assurez-vous que l’initialisation rapide n’est pas sélectionnée.
    • Seule une initialisation complète (= lente) corrige le problème.
     

     

  5. Effectuez une vérification de la cohérence du nouveau disque virtuel créé.
     

    • Si la vérification de la cohérence s’effectue sans erreur, cela signifie que la baie est maintenant en bon état et que le dommage a disparu.
     

     

  6. Les données peuvent maintenant être restaurées sur le disque virtuel sain.
     

  7. Recommandation : mettez à niveau tous les firmwares de disques durs vers la version la plus récente.
     



4. Informations supplémentaires

OMSA permet d’effacer les avertissements concernant les blocs défectueux. Pour effacer les blocs défectueux, nous vous recommandons de procéder comme suit :

  • Lors de l’exécution d’une sauvegarde du disque virtuel avec l’option Verify sélectionnée, deux scénarios peuvent se produire :

    • L’opération de sauvegarde échoue sur un ou plusieurs fichiers. Dans ce cas, restaurez le fichier à partir d’une sauvegarde précédente. Après avoir restauré le fichier, passez à l’étape suivante.
    • L’opération de sauvegarde se termine sans erreur. Cela signifie qu’il n’y a pas de blocs défectueux sur la partie écrite de votre disque virtuel.
    SLN111146_en_US__2icon Remarque : si vous recevez toujours des avertissements concernant des blocs défectueux, cela signifie que les blocs défectueux se trouvent dans une zone sans données.

     
  • Exécutez Patrol Read (sous Virtual Disk Tasks dans OMSA) et consultez le journal des événements système pour vous assurer qu’aucun nouveau bloc défectueux n’est détecté. Si des blocs défectueux existent encore, passez à l’étape suivante. Sinon, le problème est supprimé.

    SLN111146_en_US__2icon Remarque : la fonction Patrol Read automatisée doit être désactivée avant que l’option d’exécution manuelle de cette action ne s’affiche dans OMSA.

     
  • Pour effacer ces blocs défectueux, exécutez la tâche Clear Virtual Disk Bad Blocks. Vous pouvez effectuer cette opération dans l’interface graphique d’OMSA ou utiliser la commande de la CLI :
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon Remarque : Pour obtenir les valeurs ID du contrôleur et ID du disque virtuel, saisissez omreport storage controller pour afficher les ID du contrôleur, puis saisissez omreport storage vdisk controller=ID pour afficher les ID des disques virtuels

     

Affected Products

Servers
Article Properties
Article Number: 000139277
Article Type: Solution
Last Modified: 18 Nov 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.