跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表

Dell PowerEdge 13G — возможная перезагрузка после «исправимых ошибок памяти»

摘要: Как исправить перезагрузку после сообщения «Correctable memory error rate exceeded for DIMM_xx» на некоторых серверах PowerEdge 13G

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

iDRAC записыет следующее событие: MeM0702 Correctable memory error rate exceeded for DIMM (Bank/Slot)

 

原因

Содержание

1. Описание
2. Решение
3. Дополнительная информация:
 

 


Описание

Исправимая ошибка памяти — это однобитная ошибка, которая возникает, когда бит по ошибке меняется с 1 на 0 или с 0 на 1 во время операции записи или чтения. При обнаружении ошибочного бита ошибка исправляется путем его дополнения. Модули DIMM, сертифицированные Dell, выполняют эту коррекцию автоматически.
В редких случаях сервер может перезагрузиться после записи исправимой ошибки памяти в журнал SEL. Это отображается только в BIOS версии 2.3.x.

Примере:

MeM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
Для MEM0702 превышена частота критических
исправимых ошибок памяти DIMM_xx.

Пример журнала LC:

2017-03-07 23:08:02 Сброс системного процессора SYS1003.
2017-03-07 23:08:02 Система SYS1001 выключается.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

解决方案


Решение

Для устранения проблемы перезагрузки необходимо обновить BIOS до последней версии. Если это невозможно по эксплуатационным причинам, необходимо установить хотя бы те версии BIOS, которые перечислены ниже:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
Все модульные блейд-системы 2.4.2
Таблица 1. Соответствующие версии и модели BIOS
 
SLN305799_en_US__1icon Эта проблема не затрагивает серверы T130, R230, T330, R330 и R930. 
SLN305799_en_US__1icon Если после обновления BIOS возникают устранимые ошибки памяти, необходимо выполнить стандартный процесс поиска и устранения неисправностей.

 


Дополнительная информация

Эта проблема в основном была выявлена в PowerEdge R630 и R730, однако она существует во всех серверах 13-го поколения с BIOS версии 2.3.x. В BIOS версии 2.3.x было введено изменение для дополнительного ведения журнала в базе данных политик безопасности (SPD), в результате которого была представлена эта конкретная проблема:

"Разыменение указателя NULL в расширенном журнале SPD BIOS после превышения критического порогового значения исправимой ошибки памяти приведет к проверке или блокировке компьютера".

Ранее указанные версии BIOS для затронутых платформ устраняют проблему перезагрузки сервера в сочетании с сообщением о превышении у исправимой скорости ошибок.

В основном эта проблема была выявлена в R630 и R730.  Эта проблема может возникнуть на всех серверах PowerEdge 13G с BIOS версии 2.3.x.

受影响的产品

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
文章属性
文章编号: 000141221
文章类型: Solution
上次修改时间: 18 7月 2023
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。