Numéro d’article: 000144821
ПРИМЕЧАНИЕ. Эта статья не применима к более новым системам с масштабируемыми процессорами Xeon. Для более новых систем см. эту статью Что такое самовосстановление DDR4 на серверах Dell PowerEdge с масштабируемыми процессорами Intel Xeon?
Поиск и устранение ошибок памяти в системах PowerEdge путем тестовой замены
Если в одной или нескольких ячейках памяти DIMM отображается одноразрядная ошибка (SBE) и/или многоразрядная ошибка (MBE), причина может заключаться не в самом модуле DIMM, поэтому необходимо выполнить простую процедуру поиска и устранения неисправностей, чтобы определить, где именно находится неисправность. Пример ошибок памяти, появляющихся в интерфейсе iDRAC на компьютере R715, приведен на рис. 1 .
Рисунок 1: Ошибки памяти, отображаемые в журналах iDRAC 6 (Только на английском языке)
Локализация проблем с памятью означает перемещение модулей памяти DIMM по разным разъемам памяти, каналам, банкам и контроллерам. Существует несколько способов замены модулей DIMM, чтобы определить положение неисправности. Для обнаружения неисправного модуля DIMM или разъема может потребоваться применить несколько из этих способов. Ниже приведено представление этих способов. Чтобы объяснить это просто, мы предположим, что неисправный модуль DIMM — A1 или один из наборов, отмеченных синим цветом на изображениях.
Наилучший способ определения неисправных модулей DIMM или модулей DIMM — это лучший способ определения неисправных модулей DIMM (по каналу или банку).
После того как в группе модулей DIMM обнаружены неисправные модули DIMM или модули DIMM, можно использовать перемещение отдельных модулей DIMM, чтобы определить, какие модули DIMM неисправны.
Замена DIMM A1 (помеченного синим цветом) модулем DIMM A9 (помеченным красным цветом) для проверки модуля DIMM на другом банке и канале памяти
Рис. 2. Замена DIMM A1 модулем DIMM A9
При замене модуля DIMM A1 (отмечен синим цветом) на модуль DIMM B1 (отмечен красным) модуль DIMM переходит на совершенно другой контроллер памяти (ЦП).
Рисунок 3: Замена DIMM A1 модулем DIMM B1
При замене всего банка модулей DIMM (A1, A2, A3 - синий) на другой банк (B1, B2, B3 - красный) выполняется проверка всего банка DIMM в новом банке на новом контроллере памяти.
Рисунок 4. Замена модулей DIMM A1, A2, A3 модулями DIMM B1, B2, B3
Заменив весь канал модулей DIMM (A1, A4, A7 - отмечен синим цветом) на другой канал (B1, B2, B3 - отмечен красным), проверьте весь канал модулей DIMM в новом канале и на новом контроллере памяти.
Рисунок 5. Замена модулей DIMM A1, A4, A7 модулями DIMM B1, B4, B7
Как правило, ошибки DIMM следуют за модулями DIMM, указанными в ошибках. Например, если модуль памяти DIMM A1 сообщает об ошибке SBE, то при замене этого модуля DIMM на другой произойдет одно из следующих событий.
Неприменимо
Неприменимо
PowerEdge
15 avr. 2024
8
Solution