Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Dell PowerEdge 13G – możliwe ponowne uruchomienie po „usuwalnych błędach pamięci”

Summary: Jak skorygować ponowne uruchomienie po wystąpieniu błędu „Liczba usuwalnych błędów pamięci przekroczona dla DIMM_xx.” na niektórych serwerach PowerEdge 13G

This article applies to   This article does not apply to 

Symptoms

Kontroler iDRAC rejestruje następujące zdarzenie: MEM0702 Liczba usuwalnych błędów pamięci przekroczona dla dimm (bank/gniazdo)

 

Cause

Spis treści

1. Opis
2. Rozwiązanie
3. Szczegółowe informacje
 

 


Opis

Usuwalny błąd pamięci to błąd jednobitowy, który występuje, gdy bit błędnie zmieni się z 1 na 0 lub z 0 na 1 podczas operacji zapisu lub odczytu. Po zidentyfikowaniu konkretnego bitu błędu błąd jest korygowany przez uzupełnienie błędnego bitu. Moduły DIMM certyfikowane przez firmę Dell automatycznie przeprowadzają tą korekcję.
W rzadkich przypadkach serwer może uruchomić się ponownie po zarejestrowaniu usuwalnego błędu pamięci w dzienniku SEL. Ta funkcja jest dostępna tylko w systemie BIOS w wersji 2.3.x.

Przykład:

MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable memory error rate exceeded for DIMM_xx.


LC Log example:

2017-03-07 23:08:02 SYS1003 System CPU Resetting.
2017-03-07 23:08:02 SYS1001 System is turning off.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

Resolution


Rozwiązanie

Aby rozwiązać problem z ponownym uruchamianiem, należy zaktualizować system BIOS do najnowszej wersji. Jeśli nie jest to możliwe ze względów operacyjnych, system BIOS należy zaktualizować do jednej z poniższych wersji minimalnych:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
Wszystkie modułowe serwery kasetowe 2.4.2
Tabela 1: Odpowiednie wersje systemu BIOS i modele
 
SLN305799_en_US__1iconTen problem nie dotyczy modeli T130, R230, T330, R330 i R930. 
SLN305799_en_US__1iconJeśli usuwalne błędy pamięci wystąpią po aktualizacji systemu BIOS, należy wdrożyć standardowy proces rozwiązywania problemów.

 


Więcej informacji

Ten problem został uprzednio zgłoszony w przypadku serwerów PowerEdge R630 i R730, jednak potencjalnie może też wystąpić we wszystkich serwerach 13G z systemem BIOS w wersji 2.3.x. W systemie BIOS w wersji 2.3.x wprowadzono zmianę dotyczącą dodatkowego rejestrowania w bazie danych zasad zabezpieczeń (SPD), co wywołało ten konkretny problem:

„A NULL pointer dereferencing in BIOS enhanced SPD logging after memory correctable error critical threshold exceeded, would cause system to machine check or lock up.”

Wymienione wcześniej wersje systemu BIOS dla platform, których dotyczy problem, rozwiążą problem ponownego uruchomienia serwera w połączeniu z komunikatem o przekroczeniu liczby usuwalnych błędów.

Problem został wcześniej zgłoszony w R630 i R730.  Istnieje możliwość wystąpienia problemu we wszystkich serwerach PowerEdge 13G z systemem BIOS w wersji 2.3.x.

Affected Products

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
Article Properties
Article Number: 000141221
Article Type: Solution
Last Modified: 18 Jul 2023
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.
Article Properties
Article Number: 000141221
Article Type: Solution
Last Modified: 18 Jul 2023
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.