跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表

Dell PowerEdge 13G - Possible Reboot After "Correctable Memory Errors" (Dell PowerEdge 13G – möglicher Neustart nach "Korrigierbare Speicherfehler")

摘要: Anleitung zum Korrigieren des Neustarts nach "Correctable memory error rate exceeded for DIMM_xx" (Anzahl der korrigierbaren Speicherfehler wurde bei DIMM_xx überschritten) auf bestimmten PowerEdge 13G-Servern ...

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

iDRAC protokolliert das folgende Ereignis: MEM0702: Fehlerrate des korrigierbaren Speichers für DIMM überschritten (Bank/Steckplatz)

 

原因

Inhaltsverzeichnis

1. Beschreibung
2. Lösung
3. Weitere Informationen
 

 


Beschreibung

Ein korrigierbarer Arbeitsspeicherfehler ist ein Single-Bit-Fehler, der auftritt, wenn ein Bit während eines Schreib-oder Lesevorgangs fälschlicherweise von 1 auf 0 oder von 0 auf 1 wechselt. Wenn das konkrete falsche Bit identifiziert wird, wird der Fehler durch die Ergänzung des falschen Bits korrigiert. Von Dell zertifizierte DIMMs führen diese Korrektur automatisch durch.
In seltenen Fällen kann ein Server neu gestartet werden, nachdem ein korrigierbarer Speicherfehler im SEL-Protokoll aufgezeichnet wurde. Dies wird nur in der BIOS-Version 2.3.x angezeigt.

Beispiel:

MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable memory error rate exceeded for DIMM_xx.


Lc-Protokollbeispiel:

2017-03-07 23:08:02 SYS1003 System CPU Resetting.
2017-03-07 23:08:02 SYS1001 System is turning off.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

解决方案


Lösung

Um das Neustart-Problem zu beheben, sollte das BIOS auf die aktuellste Version aktualisiert werden. Wenn dies aus betrieblichen Gründen nicht möglich ist, sollte das BIOS auf die unten aufgeführten Mindestversionen aktualisiert werden:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
Alle modularen Blades 2.4.2
Tabelle 1: Relevante BIOS-Versionen und -Modelle
 
SLN305799_en_US__1icon T130, R230, T330, R330 und R930 sind von diesem Problem nicht betroffen. 
SLN305799_en_US__1icon Wenn nach der BIOS-Aktualisierung korrigierbare Speicherfehler auftreten, sollte ein standardbasierter Fehlerbehebungsprozess implementiert werden.

 


Weitere Informationen

Dieses Problem wurde in erster Linie im PowerEdge R630 und R730 gemeldet, aber das Potenzial besteht in allen 13G mit einer BIOS-Version von 2.3.x. In der BIOS-Version 2.3.x wurde eine Änderung für die zusätzliche Protokollierung in der Security Policy Database (SPD) eingeführt, die dieses spezielle Problem einführte:

"Eine NULL-Zeiger-Dereferenzierung in der verbesserten SPD-Protokollierung im BIOS, nachdem der kritische Schwellenwert für den korrigierbaren Speicherfehler überschritten wurde, würde dazu führen, dass das System eine Computerprüfung oder -sperrung durchführen kann."

Die zuvor angegebenen BIOS-Versionen für die betroffenen Plattformen beheben das Problem beim Neustart des Servers in Verbindung mit der Meldung "Correctable Error Rate exceeded".

Das Problem wurde hauptsächlich in R630 und R730 gemeldet.  Die Möglichkeit des Problems besteht bei allen PowerEdge 13G-Servern mit BIOS-Version 2.3.x.

受影响的产品

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
文章属性
文章编号: 000141221
文章类型: Solution
上次修改时间: 18 7月 2023
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。