iDRAC registreert de volgende gebeurtenis: MEM0702 Corrigeerbare geheugenfoutsnelheid overschreden voor DIMM (bank/slot)
1. Beschrijving
2. Oplossing
3. Meer informatie
Een corrigeerbare geheugen fout is een single-bit fout die zich voordoet als een bit per ongeluk wordt gewijzigd van 1 in 0 of van 0 in 1 tijdens een schrijf-of leesbewerking. Wanneer het specifieke, foutieve bit wordt geïdentificeerd, wordt de fout gecorrigeerd door het foutieve bit aan te vullen. Dell gecertificeerde DIMM's voeren deze correctie automatisch uit.
In zeldzame gevallen kan een server opnieuw opstarten nadat een corrigeerbare geheugenfout is vastgelegd in het SEL-logboek. Dit is alleen te zien in BIOS-versie 2.3.x.
Voorbeeld:
MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable Memory error rate exceeded for DIMM_xx.
Voorbeeld LC-logboek:
2017-03-07 23:08:02 SYS1003 Systeem CPU resetten.
2017-03-07 23:08:02 SYS1001 Systeem wordt uitgeschakeld.
2017-03-07 23:08:02 MEM0702 Corrigeerbare geheugenfoutsnelheid overschreden voor DIMM_xx.
Om het probleem van het opnieuw opstarten op te lossen, moet het BIOS worden bijgewerkt naar de meest recente versie. Als dit niet mogelijk is om operationele redenen, moet het BIOS worden bijgewerkt tot de volgende minimumversies:
R430 | 2.4.2 |
T430 | 2.4.2 |
R530 | 2.4.2 |
T630 | 2.4.2 |
R630 | 2.4.3 |
R730 | 2.4.3 |
R830 | 1.4.2 |
C4130 | 2.4.2 |
C6320 | 2.4.2 |
Alle modulaire blades | 2.4.2 |
Meer informatie
Dit probleem is vooral gemeld in de PowerEdge R630 en R730, maar het potentieel bestaat in alle 13G met een BIOS-versie van 2.3.x. Er is een wijziging geïntroduceerd in BIOS-versie 2.3.x voor aanvullende logboekregistratie bij Security Policy Database (SPD) die dit specifieke probleem introduceerde:
"Een NULL-aanwijzer dereferencing in BIOS enhanced SPD logging after memory correctable error critical threshold exceeded, would cause system to machine check or lock up."
De eerder vermelde BIOS-versies voor de getroffen platforms zullen het probleem met opnieuw opstarten van de server oplossen in combinatie met het bericht 'Correctable error rate exceeded'.
Het probleem is vooral gemeld in R630 en R730. Het probleem kan zich voordoen in alle PowerEdge 13G-servers met BIOS versie 2.3.x.