Número del artículo: 000144821
UWAGA: ten artykuł nie dotyczy nowszych komputerów ze skalowalnym procesorem Xeon. W przypadku nowszych systemów zapoznaj się z tym artykułem Co to jest autonaprawa pamięci DDR4 na serwerach Dell PowerEdge ze skalowalnymi procesorami Intel Xeon.
Rozwiązywanie problemów z błędami pamięci w systemach PowerEdge poprzez testy różnych modułów pamięci
W przypadku zgłoszenia błędu jednobitowego (SBE) i/lub błędu wielobitowego (MBE) w jednej lub większej liczbie lokalizacji modułów pamięci DIMM przyczyna może nie leżeć po stronie samego modułu DIMM. Należy więc przeprowadzić proste rozwiązywanie problemów, aby dokładnie określić, gdzie dokładnie leży usterka. Przykład błędów pamięci pojawiających się w interfejsie kontrolera iDRAC serwera R715 przedstawiono na rys. 1 .
Rysunek 1: Błędy pamięci wyświetlane w dziennikach kontrolera iDRAC 6 (Tylko w języku angielskim)
Izolowanie problemów z pamięcią oznacza wymianę modułów pamięci DIMM na różne gniazda, kanały, banki i kontrolery. Istnieje kilka sposobów wymiany modułów DIMM w celu określenia usterki. Konieczne może być zastosowanie więcej niż jednej z tych metod w celu zidentyfikowania uszkodzonego modułu DIMM lub gniazda. Poniżej znajduje się prezentacja tych metod. Aby uprościć wyjaśnienie, zakładamy, że wadliwy moduł DIMM to A1 lub jeden z zestawów oznaczonych kolorem niebieskim na ilustracjach.
Wymiana modułów DIMM w grupach (według kanału lub banku), a nie pojedynczo to najlepsza metoda identyfikacji uszkodzonych modułów DIMM.
Po zidentyfikowaniu grupy modułów DIMM, które zawierają uszkodzone moduły DIMM, można użyć pojedynczych modułów DIMM do zidentyfikowania, które moduły DIMM uległy awarii.
Zamiana modułu DIMM A1 (oznaczonego na niebiesko) na moduł DIMM A9 (oznaczonego na czerwono) w celu podłączenia modułu DIMM do innego kanału i banku
pamięci Rysunek 2: Zamiana modułu DIMM A1 na DIMM A9
Zamiana modułu DIMM A1 (oznaczonego kolorem niebieskim) na moduł DIMM B1 (zaznaczonego na czerwono) powoduje umieszczenie modułu DIMM na zupełnie innym kontrolerze pamięci (CPU).
Rysunek 3: Zamiana modułu DIMM A1 na DIMM B1
Zamiana całego banku modułów DIMM (A1, A2, A3 — oznaczonych na niebiesko) na inny bank (B1, B2, B3 — oznaczonych na czerwono) spowoduje przetestowanie całego banku modułów DIMM w nowym banku na nowym kontrolerze pamięci.
Rysunek 4: Wymiana modułów DIMM A1, A2, A3 na moduły DIMM B1, B2, B3
Zamiana całego kanału modułów DIMM (A1, A4, A7 — oznaczonych na niebiesko) na inny kanał (B1, B2, B3 — oznaczony na czerwono) Przetestuj cały kanał modułów DIMM w nowym kanale i na nowym kontrolerze pamięci.
Rysunek 5: Wymiana modułów DIMM A1, A4, A7 na moduły DIMM B1, B4, B7
Ogólnie rzecz biorąc, błędy modułów DIMM są zwykle powiązane z modułami DIMM określonymi w błędach. Na przykład w przypadku zgłaszania SBE modułu DIMM A1 zamiana tego modułu DIMM na inny moduł DIMM powoduje jeden z następujących rezultatów:
Nie dotyczy
Nie dotyczy
PowerEdge
15 abr 2024
8
Solution