Les contrôleurs Dell PERC9 (H330, H730, H730P et H830) ont introduit une fonctionnalité appelée Rapid Rebuild (Reconstruction rapide), qui accélère la reconstruction des disques défaillants dans certaines conditions. Cette fonctionnalité est basée sur T10 Rebuild Assist. Dell a déterminé qu’il existe un risque de problème d’intégrité des données lorsque cette fonctionnalité est utilisée dans certaines conditions.
Sommaire
- Fonctionnement
- Énoncé du problème
- Comment puis-je savoir si cela me concerne ?
- Solution
Fonctionnement :
N’importe quel disque compatible avec la fonctionnalité de reconstruction rapide enregistre la fonctionnalité depuis le contrôleur. Cette fonctionnalité est prise en charge avec les disques virtuels avec parité raid : Raid 5, RAID 6, RAID 50 et RAID 60. Elle nécessite que le serveur soit équipé de disques compatibles, offre des niveaux de parité RAID et soit doté d’un disque de secours configuré (global ou dédié au disque virtuel). Chaque disque compatible dans le disque virtuel assure le suivi de ses propres blocs/secteurs défectueux. Un disque peut échouer de telle sorte qu’il peut toujours communiquer avec le contrôleur PERC et indiquer au contrôleur PERC quels secteurs sont toujours « bons ». Au lieu d’exécuter des algorithmes XOR de récupération RAID chronophages pour l’ensemble du disque, le contrôleur PERC copie les secteurs en bon état sur le disque de secours et récupère uniquement les secteurs détectés comme défectueux. Le contrôleur PERC copie les secteurs en bon état sur le disque de secours et ne reconstruit que les secteurs détectés comme défectueux. Sans la reconstruction rapide, le contrôleur PERC doit reconstruire tous les secteurs, ce qui peut prendre beaucoup de temps pour les disques de grande capacité.
Énoncé du problème
Lorsque le contrôleur PERC reconstruit les données des secteurs défectueux, il écrit les données de la mémoire cache sur le disque défectueux au lieu de les écrire sur le disque de secours. Du coup, les données et la parité associée ne sont ne pas écrites sur le disque de secours. En mode d’écriture immédiate, des erreurs de parité se produisent. En mode d’écriture conditionnelle, des erreurs de données et de parité associée se produisent.
Comment puis-je savoir si cela me concerne ?
Remarque : vous trouverez dans l’
article SLN295784 des explications sur l’extraction des journaux du contrôleur PERC.
Si vous voyez le texte en surbrillance ci-dessous dans le journal du contrôleur PERC, cela signifie que vous avez rencontré ce problème.
C0:EVT#395950-08/17/16 13:54:59: 114=State change on PD 0b(e0x20/s11) from OFFLINE(XX) to REBUILDASSIST(12)
Solution
-
Si votre disque virtuel se trouvait en mode d’écriture immédiate, seules les données de parité risquent d’être endommagées. Exécutez une vérification de cohérence (CC) pour restaurer la parité. Cela ne fonctionne que s’il s’agit d’une occurrence unique de Rebuild Assist. Si plusieurs occurrences concernent le même disque virtuel, vous devez restaurer vos données à partir d’une sauvegarde précédente.
-
Si votre disque virtuel se trouvait en mode d’écriture conditionnelle et que vous avez rencontré ce problème, vous devez restaurer vos données à partir de votre sauvegarde. Malheureusement, il est impossible de récupérer les données perdues. Effectuez la restauration à partir d’une sauvegarde précédente.
Si vous n’avez pas rencontré ce problème, afin de vous protéger contre ce scénario, veuillez mettre à jour le firmware du PERC H730, H730p ou H830 vers la version 25.5.0.0018 et le firmware du PERC H330 vers la version 25.5.0.0019, ou une version ultérieure, ce qui permettra de désactiver la fonctionnalité Rapid Rebuild (Reconstruction rapide).
Pour télécharger la dernière version du micrologiciel, accédez à la section « Drivers and Downloads » (Pilotes et téléchargements) pour les serveurs 13G et développez le fichier de menu « SAS Raid » (Raid SAS).
Le bon micrologiciel a été implémenté en usine, les nouveaux serveurs ne sont donc pas exposés à ce problème.
Remarque de Dell : dans le cadre de l’amélioration continue des processus commerciaux pour toutes les fonctions clés, Dell passe en revue les principaux processus et implémente des améliorations en continu. Dell accorde une attention toute particulière au développement, aux tests et aux processus de fabrication de ses systèmes de stockage et de ses serveurs. Ces améliorations de processus permettent d’éviter des problèmes ultérieurs et aident nos équipes à résoudre plus rapidement et plus efficacement les problèmes potentiels rencontrés sur site.