L’iDRAC consigne l’événement suivant: Taux d’erreurs de mémoire corrigibles MEM0702 dépassé pour DIMM (banque/logement)
1. Description
2. Solution
3. Autres informations
Une erreur de mémoire réparable est une erreur d’un seul bit, qui se produit lorsqu’un bit passe par erreur de 1 à 0 ou de 0 à 1, lors d’une opération d’écriture ou de lecture. Lorsque le bit spécifique de l’erreur est identifié, l’erreur est corrigée en modifiant le bit erroné. Les modules DIMM certifiés par Dell effectuent cette correction automatiquement.
Dans de rares cas, le serveur peut redémarrer une fois que l’erreur de mémoire réparable est enregistrée dans le journal SEL. Cela n’apparaît que dans la version 2.3.x du BIOS.
Exemple :
MeM0701 Avertissement Taux d’erreurs de mémoire corrigibles dépassé pour DIMM_xx.
Taux d’erreurs critiques de mémoire corrigibles meM0702 dépassé pour DIMM_xx.
Exemple de journal LC :
2017-03-07 23:08:02 SYS1003 Réinitialisation du processeur du système.
2017-03-07 23:08:02 SYS1001 Le système s’éteint.
2017-03-07 23:08:02 MEM0702 Taux d’erreur de mémoire corrigible dépassé pour DIMM_xx.
Afin de résoudre le problème de redémarrage, le BIOS doit être mis à jour vers la version la plus récente. Si ce n’est pas possible pour des raisons opérationnelles, le BIOS doit être ramené aux versions minimales, comme indiqué ci-dessous :
R430 | 2.4.2 |
T430 | 2.4.2 |
R530 | 2.4.2 |
T630 | 2.4.2 |
R630 | 2.4.3 |
R730 | 2.4.3 |
R830 | 1.4.2 |
C4130 | 2.4.2 |
C6320 | 2.4.2 |
Tous les serveurs lames modulaires | 2.4.2 |
Plus d’informations
Ce problème a principalement été signalé sur les serveurs PowerEdge R630 et R730, mais il peut également se produire sur tous les serveurs 13G avec la version 2.3.x du BIOS. Une modification avait été introduite dans le BIOS version 2.3.x pour permettre une connexion supplémentaire à la base de données des stratégies de sécurité (SPD), qui a généré ce problème particulier :
« Le déréférencement d’un pointeur NULL dans la journalisation SPD améliorée du BIOS après dépassement du seuil critique d’erreurs réparables de la mémoire entraîne la vérification ou le verrouillage du système ».
Les versions du BIOS précédemment citées pour les plates-formes concernées permettent de résoudre le problème de redémarrage du serveur ainsi que le message de dépassement du taux d’erreurs réparables.
Le problème a principalement été signalé sur les modèles R630 et R730. Il est toujours susceptible de se produire sur tous les serveurs PowerEdge 13G avec la version 2.3.x du BIOS.