Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

Dell PowerEdge 13G – Možné restartování po zobrazení chyb „Correctable Memory Errors“

Summary: Jak na některých serverech PowerEdge 13G opravit restartování po chybě „Correctable memory error rate exceeded for DIMM_xx“.

This article applies to   This article does not apply to 

Symptoms

Řadič iDRAC zahlásí následující událost: MEM0702 Correctable memory error rate exceeded for DIMM (Bank/Slot)

 

Cause

Obsah

1. Popis
2. Řešení
3. Další informace
 

 


Popis

„Correctable Memory Error“ je jednobitová chyba, ke které dochází v případě chybné změny bitu z hodnoty 1 na 0 nebo z 0 na 1 při zápisu nebo čtení. Když je identifikován konkrétní chybový bit, je chyba napravena doplněním chybného bitu. Paměti DIMM certifikované společností Dell tuto opravu provádějí automaticky.
V ojedinělých případech se server může resetovat po zaznamenání chyby Correctable Memory Error do protokolu SEL. K tomu došlo pouze v systému BIOS verze 2.3.x.

Příklad:

MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable memory error rate exceeded for DIMM_xx.


Příklad protokolu LC:

2017-03-07 23:08:02 SYS1003 System CPU Resetting.
2017-03-07 23:08:02 SYS1001 System is turning off.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

Resolution


Řešení

Pro vyřešení problému s restartováním je třeba aktualizovat systém BIOS na nejnovější verzi. Pokud to z provozních důvodů není možné, je třeba systém BIOS aktualizovat alespoň na verze uvedené níže:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
Všechny modulární moduly blade 2.4.2
Tabulka 1: Příslušné verze a modely systému BIOS
 
SLN305799_en_US__1icon Modelů T130, R230, T330, R330 a R930 se tento problém netýká. 
SLN305799_en_US__1icon Pokud po aktualizaci systému BIOS dojde k chybám Correctable Memory Error, měli byste se uchýlit ke standardnímu postupu odstraňování problémů.

 


Další informace

Tento problém byl primárně hlášen v serverech PowerEdge R630 a R730, nicméně ve všech serverech 13G existuje možnost s verzí systému BIOS 2.3.x. V systému BIOS verze 2.3.x byla zavedena změna pro další protokolování do databáze zásad zabezpečení (SPD), která způsobila tento konkrétní problém:

„A NULL pointer dereferencing in BIOS enhanced SPD logging after memory correctable error critical threshold exceeded, would cause system to machine check or lock up.“

Problém s restartováním serveru ve spojení s chybovou zprávou Correctable Error Rate Exceeded vyřeší dříve uvedené verze systému BIOS pro dotčené platformy.

Problém byl primárně hlášen u systémů R630 a R730.  Problém může potenciálně vzniknout ve všech serverech PowerEdge 13G se systémem BIOS verze 2.3.x.

Affected Products

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...