Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

Rozwiązywanie problemów z błędami pamięci w systemach PowerEdge poprzez testy różnych modułów pamięci

Summary: Wymiana modułów pamięci DIMM w celu rozwiązywania problemów z pamięcią w serwerach Dell Technologies PowerEdge.

This article applies to   This article does not apply to 

Symptoms

UWAGA: ten artykuł nie dotyczy nowszych komputerów ze skalowalnym procesorem Xeon. W przypadku nowszych systemów zapoznaj się z tym artykułem Co to jest autonaprawa pamięci DDR4 na serwerach Dell PowerEdge ze skalowalnymi procesorami Intel Xeon.

Rozwiązywanie problemów z błędami pamięci w systemach PowerEdge poprzez testy różnych modułów pamięci

W przypadku zgłoszenia błędu jednobitowego (SBE) i/lub błędu wielobitowego (MBE) w jednej lub większej liczbie lokalizacji modułów pamięci DIMM przyczyna może nie leżeć po stronie samego modułu DIMM. Należy więc przeprowadzić proste rozwiązywanie problemów, aby dokładnie określić, gdzie dokładnie leży usterka. Przykład błędów pamięci pojawiających się w interfejsie kontrolera iDRAC serwera R715 przedstawiono na rys. 1 .

Dzienniki kontrolera iDRAC 6
Rysunek 1: Błędy pamięci wyświetlane w dziennikach kontrolera iDRAC 6 (Tylko w języku angielskim)

Izolowanie problemów z pamięcią oznacza wymianę modułów pamięci DIMM na różne gniazda, kanały, banki i kontrolery. Istnieje kilka sposobów wymiany modułów DIMM w celu określenia usterki. Konieczne może być zastosowanie więcej niż jednej z tych metod w celu zidentyfikowania uszkodzonego modułu DIMM lub gniazda. Poniżej znajduje się prezentacja tych metod. Aby uprościć wyjaśnienie, zakładamy, że wadliwy moduł DIMM to A1 lub jeden z zestawów oznaczonych kolorem niebieskim na ilustracjach.

Wymiana modułów DIMM w grupach (według kanału lub banku), a nie pojedynczo to najlepsza metoda identyfikacji uszkodzonych modułów DIMM.
Po zidentyfikowaniu grupy modułów DIMM, które zawierają uszkodzone moduły DIMM, można użyć pojedynczych modułów DIMM do zidentyfikowania, które moduły DIMM uległy awarii.


Metoda 1:

Zamiana modułu DIMM A1 (oznaczony na niebiesko) z modułem DIMM A9 (oznaczony na czerwono) w celu wypróbowania modułu DIMM w innym kanale pamięci i banku

Moduły DIMM od A1 do A9
Rysunek 2: Zamiana modułu DIMM A1 na DIMM A9
 

Metoda 2:

Zamiana modułu DIMM A1 (oznaczonego kolorem niebieskim) na moduł DIMM B1 (zaznaczonego na czerwono) powoduje umieszczenie modułu DIMM na zupełnie innym kontrolerze pamięci (CPU).

Moduły DIMM od A1 do B1
Rysunek 3: Zamiana modułu DIMM A1 na DIMM B1
 

Metoda 3:

Zamiana całego banku modułów DIMM (A1, A2, A3 — oznaczonych na niebiesko) na inny bank (B1, B2, B3 — oznaczonych na czerwono) spowoduje przetestowanie całego banku modułów DIMM w nowym banku na nowym kontrolerze pamięci.

Od DIMMA 123 do B123
Rysunek 4: Wymiana modułów DIMM A1, A2, A3 na moduły DIMM B1, B2, B3
 

Metoda 4

Zamiana całego kanału modułów DIMM (A1, A4, A7 — oznaczonych na niebiesko) na inny kanał (B1, B2, B3 — oznaczony na czerwono) Przetestuj cały kanał modułów DIMM w nowym kanale i na nowym kontrolerze pamięci.

Moduły DIMM od A147 do B147
Rysunek 5: Wymiana modułów DIMM A1, A4, A7 na moduły DIMM B1, B4, B7
 

Analiza wyników po wymianie modułów DIMM

Ogólnie rzecz biorąc, błędy modułów DIMM są zwykle powiązane z modułami DIMM określonymi w błędach. Na przykład w przypadku zgłaszania SBE modułu DIMM A1 zamiana tego modułu DIMM na inny moduł DIMM powoduje jeden z następujących rezultatów:

  1. Komunikat o błędzie nie jest już zgłaszany, a problem został rozwiązany
  •   Oznacza to, że ponowne osadzenie modułów pamięci rozwiązało problem
  1. Komunikat o błędzie jest powiązany z modułem DIMM (moduł DIMM A1 zostały zamieniony na moduł DIMM B1, a komunikaty o błędach są teraz zgłaszane w odniesieniu do modułu DIMM B1)
  • Oznacza to, że moduł DIMM najprawdopodobniej nie działa i wymaga wymiany.
  1. Komunikat o błędzie jest zgodny z gniazdem DIMM (moduł DIMM A1 został zamieniony na DIMM B1, a komunikaty o błędach są nadal zgłaszane w odniesieniu do modułu DIMM A1)
  • Najprawdopodobniej oznacza to awarię płyty głównej lub procesora.
  • Wymiana procesora potwierdza, który element wymaga wymiany.
  • Jeśli problem jest związany z procesorem (komunikat o błędzie zostaje przeniesiony po wymianie procesora), wymień procesor
  • Jeśli problem nadal występuje w gnieździe DIMM, należy wymienić płytę główną.
  1. Komunikat o błędzie nie zostaje przeniesiony po wymianie modułu DIMM lub gniazda (błąd jest zgłaszany w odniesieniu do innego modułu DIMM po zamianie)
  • Oznacza to, że inne moduły DIMM są najprawdopodobniej uszkodzone.
 
UWAGA: Zalecamy również aktualizowanie poziomów oprogramowania wewnętrznego, ponieważ może to zmniejszyć ryzyko wystąpienia błędów pamięci i wydłużyć żywotność modułów DIMM.
Więcej informacji można uzyskać w artykule bazy wiedzy firmy Dell Dell Repository Manager (DRM).

Cause

Nie dotyczy

Resolution

Nie dotyczy

Affected Products

PowerEdge C1100, PowerEdge C2100, PowerEdge C5125, PowerEdge C5220, PowerEdge C5230, PowerEdge C6105, PowerEdge C6145, PowerEdge C6220, PowerEdge C6220 II, PowerEdge c6320

Products

PowerEdge c6320p, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M420, PowerEdge M520, PowerEdge M520 (for PE VRTX), PowerEdge M600, PowerEdge M605, PowerEdge M610, PowerEdge M610x, PowerEdge M620, PowerEdge M620 (for PE VRTX) , PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M710, PowerEdge M710HD, PowerEdge M805, PowerEdge M820, PowerEdge M820 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge M905, PowerEdge M910, PowerEdge M915, PowerEdge R200, PowerEdge R210, PowerEdge R210 II, PowerEdge R220, PowerEdge R230, PowerEdge R300, PowerEdge R310, PowerEdge R320, PowerEdge R330, PowerEdge R410, PowerEdge R415, PowerEdge R420, PowerEdge R430, PowerEdge R510, PowerEdge R515, PowerEdge R520, PowerEdge R530, PowerEdge R530xd, PowerEdge R610, PowerEdge R620, PowerEdge R630, PowerEdge R710, PowerEdge R715, PowerEdge R720, PowerEdge R720XD, PowerEdge R730, PowerEdge R730xd, PowerEdge R805, PowerEdge R810, PowerEdge R815, PowerEdge R820, PowerEdge R830, PowerEdge R900, PowerEdge R905, PowerEdge R910, PowerEdge R920, PowerEdge R930, PowerEdge T100, PowerEdge T105, PowerEdge T110, PowerEdge T110 II, PowerEdge T130, PowerEdge T20, PowerEdge T30, PowerEdge T300, PowerEdge T310, PowerEdge T320, PowerEdge T330, PowerEdge T410, PowerEdge T420, PowerEdge T430, PowerEdge T605, PowerEdge T610, PowerEdge T620, PowerEdge T630, PowerEdge T710 ...