Número del artículo: 000144821
HINWEIS: Dieser Artikel gilt nicht für neuere Systeme mit skalierbarem Xeon-Prozessor. Informationen zu neueren Systemen finden Sie in diesem Artikel: Was ist die automatische DDR4-Fehlerkorrektur auf Dell PowerEdge-Servern mit skalierbaren Intel Xeon Prozessoren?
Troubleshooting von Speicherfehlern auf PowerEdge-Systemen durch Swap-Tests
Wenn ein Single-Bit-Fehler (SBE) und/oder Multi-Bit-Fehler (MBE) an einem oder mehreren DIMM-Steckplätzen gemeldet wird, liegt die Ursache möglicherweise nicht am DIMM selbst, sodass ein einfaches Troubleshooting durchgeführt werden muss, um festzustellen, wo genau der Fehler liegt. Abbildung 1 zeigt ein Beispiel für Speicherfehler, die in der iDRAC-Schnittstelle auf einem R715 auftreten.
Abbildung 1: Speicherfehler, wie in iDRAC 6-Protokollen angezeigt (Nur Englisch)
Die Isolierung von Speicherproblemen bedeutet das Austauschen von Speicher-DIMMs in verschiedene Speichersockel, -kanäle, -bänke und -controller. Es gibt mehrere Möglichkeiten, die DIMMs auszutauschen, um den Fehler einzugrenzen. Möglicherweise müssen Sie mehr als eine dieser Methoden verwenden, um das fehlerhafte DIMM oder den fehlerhaften Sockel zu ermitteln. Nachfolgend finden Sie eine Darstellung dieser Methoden. Um die Erklärung einfach zu machen, gehen wir davon aus, dass es sich bei dem fehlerhaften DIMM um A1 oder eines der in den Abbildungen blau markierten Sets handelt.
Das Austauschen von DIMMs in Gruppen (nach Kanal oder Bank) statt einzeln ist die beste Methode, um die fehlerhaften DIMMs oder DIMMs zu identifizieren.
Sobald eine Gruppe von DIMMs identifiziert wurde, die das fehlerhafte DIMM oder die fehlerhaften DIMMs enthält, kann durch das Verschieben einzelner DIMMs ermittelt werden, welche DIMMs ausgefallen sind.
Tauschen Sie DIMM A1 (blau markiert) durch DIMM A9 (rot markiert) aus, um das DIMM in einem anderen Speicherkanal und einer anderen Bank zu testen
Abbildung 2: Austauschen von DIMM A1 durch DIMM A9
Durch den Austausch von DIMM A1 (blau markiert) gegen DIMM B1 (rot markiert) wird das DIMM auf einem völlig anderen Speichercontroller (CPU) eingesetzt.
Abbildung 3: Austauschen von DIMM A1 durch DIMM B1
Durch den Austausch der gesamten DIMM-Bank (A1, A2, A3 - blau markiert) gegen eine andere Bank (B1, B2, B3 - rot markiert) wird die gesamte Bank von DIMMs in einer neuen Bank auf einem neuen Speicher-Controller getestet.
Abbildung 4: Austauschen der DIMMs A1, A2, A3 mit DIMMs B1, B2, B3
Tauschen Sie einen ganzen DIMM-Kanal (A1, A4, A7 - blau markiert) gegen einen anderen Kanal (B1, B2, B3 - rot markiert) aus und testen Sie den gesamten Kanal der DIMMs in einem neuen Kanal und auf einem neuen Speicher-Controller.
Abbildung 5: Austauschen der DIMMs A1, A4, A7 mit DIMMs B1, B4, B7
Im Allgemeinen folgen DIMM-Fehler in der Regel den in den Fehlern identifizierten DIMMs. Wenn beispielsweise ein SBE auf DIMM A1 gemeldet wird, führt der Austausch dieses DIMM gegen ein anderes DIMM zu einem der folgenden Ergebnisse:
Nicht zutreffend
Nicht zutreffend
PowerEdge
15 abr 2024
8
Solution