Commencer une nouvelle conversation

Non résolu

B

1  message(s)

318

14 juillet 2021 08:00

DELL RAID PERC H730P

Bonjour,

 

Je suis bloqué dans la résolution d'un incident sur un R730. Le système de stockage se compose 2 grappes RAID 5 de 3 disques SSD pour le première et 5 SAS pour la seconde.

Il y a quelques temps une erreur est apparu sur un disque SAS mais le S.I qui s'en occupait à l'époque n'ayant pas réagi le problème s'est aggravé, voici les logs depuis l'IDRAC : 

Wed Jul 14 2021 10:42:10 Drive 7 is installed in disk drive bay 1.
Wed Jul 14 2021 10:42:10 Drive 3 is installed in disk drive bay 1.
Tue Jul 13 2021 15:33:12 Drive 7 in disk drive bay 1 is operating normally.
Tue Jul 13 2021 15:33:12 Drive 7 is removed from disk drive bay 1.
Tue Jul 13 2021 07:29:07 Drive 3 in disk drive bay 1 is operating normally.
Tue Jul 13 2021 07:29:06 Drive 3 is removed from disk drive bay 1.
Mon Jul 12 2021 15:23:36 Fault detected on drive 7 in disk drive bay 1.
Mon Jul 12 2021 15:23:36 Fault detected on drive 3 in disk drive bay 1.
Mon Jul 12 2021 15:21:16 Drive 7 is installed in disk drive bay 1.
Mon Jul 12 2021 15:21:01 Drive 7 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 15:21:01 Drive 7 is removed from disk drive bay 1.
Mon Jul 12 2021 15:17:51 Drive 3 is installed in disk drive bay 1.
Mon Jul 12 2021 15:16:56 Drive 3 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 15:16:55 Drive 3 is removed from disk drive bay 1.
Mon Jul 12 2021 15:15:05 Fault detected on drive 3 in disk drive bay 1.
Mon Jul 12 2021 14:52:10 Drive 3 is installed in disk drive bay 1.
Mon Jul 12 2021 14:51:10 Drive 3 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 14:51:10 Drive 3 is removed from disk drive bay 1.
Mon Jul 12 2021 13:12:40 Fault detected on drive 7 in disk drive bay 1.
Mon Jul 12 2021 13:12:40 Fault detected on drive 3 in disk drive bay 1.
Mon Jul 12 2021 13:11:35 Drive 7 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 13:11:34 Drive 3 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 11:21:49 Fault detected on drive 7 in disk drive bay 1.
Mon Jul 12 2021 11:21:49 Fault detected on drive 3 in disk drive bay 1.
Mon Jul 12 2021 11:20:44 Drive 7 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 11:20:44 Drive 3 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 11:13:13 Fault detected on drive 7 in disk drive bay 1.
Mon Jul 12 2021 11:13:13 Fault detected on drive 3 in disk drive bay 1.
Mon Jul 12 2021 11:12:03 Drive 7 in disk drive bay 1 is operating normally.
Mon Jul 12 2021 11:12:02 Drive 3 in disk drive bay 1 is operating normally.
Sun Jul 11 2021 21:29:10 Fault detected on drive 3 in disk drive bay 1.
Mon Apr 26 2021 08:19:17 Fault detected on drive 7 in disk drive bay 1.
Thu Sep 10 2020 06:38:14 Power supply 1 is incorrectly configured.
Thu Sep 10 2020 06:38:11 Power supply redundancy is lost.
Tue Dec 20 2016 12:41:45 OEM software event.
Tue Dec 20 2016 12:41:45 C: boot completed.
Tue Dec 20 2016 12:32:52 Log cleared.

 

Depuis la panne du second disque les systèmes RAID ne démarre plus (également le RAID5 de disque SSD non touché par les précédentes erreurs). Après vérification de l'état des disques et commandes de leurs remplaçant, une autre erreur sur la carte controlleur semble maintenant avoir apparu: 

En effet, au démarrage de la machine j'ai une erreur : 

Avago EFI SAS Driver :

Unhealthy status reported by this UEFI driver without specific error message

UEFI0116 ; one or mor boot drivers have reported issues

Check the driver health menu in boot manager for details. One or more boot drivers require configuration changes. Press any key to load the drivers health manager for configuration.

Dans la config de la carte RAID PERC je n'ai plus qu'un disque virtuel correspondant à mon RAID 5 de SSD non endommagés.

L'ensemble des disques SAS apparaissent en revanche dans la partie Physical Disk management et tous avec le status Ready malgré la non initialisation du disque virtuel et l'impossibilité de le reconfigurer.

Quelqu'un aurait une idée de l'origine du problème? (la connectique CM/CFille ayant déjà été vérifiée)

 

D'avance merci

Cordialement

 

 

 

 

Moderator

 • 

8.7K  messages

14 juillet 2021 13:00

Je transfère votre message vers le forum approprié à votre langue.

4 Operator

 • 

2.7K  messages

16 juillet 2021 00:00

Bonjour @Beaucare,

 

A première vue, il pourrait s'agir d'un problème matériel du contrôleur PERC. Mais sans analyser le log du PERC lui-même, il est impossible de le déterminer. Pouvez-vous me dire quelle est la version du firmware du contrôleur PERC ?


En ce qui concerne les erreurs de disques multiples. Il peut s'agir d'une défaillance des disques eux-mêmes (là encore, il faudrait vérifier le journal pour savoir de quels modèles il s'agit et quelle est la version de leur micrologiciel) ou d'une incompatibilité s'il ne s'agit pas de disques Enterprise certifiés, ou encore de quelque chose de pire, comme des erreurs de perforation :

https://dell.to/3emeDec


Depuis l'iDRAC lui-même, vous pouvez exporter un journal TSR incluant les journaux du contrôleur PERC (assurez-vous de cocher l'option). Mais si le serveur est hors garantie, je ne peux pas analyser le journal. Si c'est le cas, vous pouvez demander un ticket d'assistance afin qu'ils puissent vérifier le journal du serveur et vous indiquer le problème.

 

J'espère que certains de mes commentaires vous ont aidé.
Cordialement.

 

Aucun événement trouvé !

Top