iDRAC logger følgende hændelse: MEM0702 Korrigerbar hukommelsesfejlrate overskredet for DIMM-modul (bank/stik)
1. Beskrivelse
2. Løsning
3. Yderligere oplysninger
En korrigerbar hukommelsesfejl er en enkelt bit-fejl, der opstår, når en bit ved en fejl ændres fra 1 til 0 eller fra 0 til 1 under en skrive- eller læsehandling. Når den specifikke bitfejl identificeres, korrigeres fejlen ved at supplere den fejlbehæftede bit. Dell-certificerede DIMM-moduler udfører denne korrektion automatisk.
I sjældne tilfælde kan en server genstarte, efter der er registreret en korrigerbar hukommelsesfejl i SEL-loggen. Dette kan kun ses i BIOS-version 2.3.x.
Eksempel:
MEM0701 Advarsel om korrigerbar hukommelsesfejlrate overskredet i DIMM_xx.
MEM0702 Kritisk korrigerbar hukommelsesfejlrate overskredet i DIMM_xx.
Eksempel på LC-log:
2017-03-07 23:08:02 SYS1003 Nulstilling af systemets CPU.
2017-03-07 23:08:02 SYS1001 Systemet slukker.
2017-03-07 23:08:02 MEM0702 Korrigerbar hukommelsesfejlrate overskredet i DIMM_xx.
BIOS skal opdateres til den nyeste version for at løse genstartsproblemet. Hvis dette af driftsmæssige årsager ikke er muligt, skal BIOS opdateres til minimumversionerne som angivet nedenfor:
R430 | 2.4.2 |
T430 | 2.4.2 |
R530 | 2.4.2 |
T630 | 2.4.2 |
R630 | 2.4.3 |
R730 | 2.4.3 |
R830 | 1.4.2 |
C4130 | 2.4.2 |
C6320 | 2.4.2 |
Alle modulopbyggede blade | 2.4.2 |
Yderligere oplysninger
Dette problem er primært blevet rapporteret i PowerEdge R630 og R730, men muligheden findes i alle 13G med en BIOS-version af 2.3.x. Der blev introduceret en ændring i BIOS-version 2.3.x for yderligere logføring til sikkerhedspolitikdatabase (SPD), som introducerede dette særlige problem:
"En NULL-pointer-dereferencing i BIOS-forbedret SPD-logføring efter kritisk tærskel for korrigerbar hukommelsesfejl er overskredet, ville få systemet til at foretage en maskinkontrol eller låse op."
De tidligere citerede BIOS-versioner til de berørte platforme løser problemet med servergenstart sammen med meddelelsen om, at en korrigerbar fejlrate er overskredet.
Problemet er primært blevet rapporteret i R630 og R730. Muligheden for at dette problem opstår, findes i alle PowerEdge 13G-servere med BIOS-version 2.3.x.