iDRAC записыет следующее событие: MeM0702 Correctable memory error rate exceeded for DIMM (Bank/Slot)
1. Описание
2. Решение
3. Дополнительная информация:
Исправимая ошибка памяти — это однобитная ошибка, которая возникает, когда бит по ошибке меняется с 1 на 0 или с 0 на 1 во время операции записи или чтения. При обнаружении ошибочного бита ошибка исправляется путем его дополнения. Модули DIMM, сертифицированные Dell, выполняют эту коррекцию автоматически.
В редких случаях сервер может перезагрузиться после записи исправимой ошибки памяти в журнал SEL. Это отображается только в BIOS версии 2.3.x.
Примере:
MeM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
Для MEM0702 превышена частота критических исправимых ошибок памяти DIMM_xx.
Пример журнала LC:
2017-03-07 23:08:02 Сброс системного процессора SYS1003.
2017-03-07 23:08:02 Система SYS1001 выключается.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.
Для устранения проблемы перезагрузки необходимо обновить BIOS до последней версии. Если это невозможно по эксплуатационным причинам, необходимо установить хотя бы те версии BIOS, которые перечислены ниже:
R430 | 2.4.2 |
T430 | 2.4.2 |
R530 | 2.4.2 |
T630 | 2.4.2 |
R630 | 2.4.3 |
R730 | 2.4.3 |
R830 | 1.4.2 |
C4130 | 2.4.2 |
C6320 | 2.4.2 |
Все модульные блейд-системы | 2.4.2 |
Дополнительная информация
Эта проблема в основном была выявлена в PowerEdge R630 и R730, однако она существует во всех серверах 13-го поколения с BIOS версии 2.3.x. В BIOS версии 2.3.x было введено изменение для дополнительного ведения журнала в базе данных политик безопасности (SPD), в результате которого была представлена эта конкретная проблема:
"Разыменение указателя NULL в расширенном журнале SPD BIOS после превышения критического порогового значения исправимой ошибки памяти приведет к проверке или блокировке компьютера".
Ранее указанные версии BIOS для затронутых платформ устраняют проблему перезагрузки сервера в сочетании с сообщением о превышении у исправимой скорости ошибок.
В основном эта проблема была выявлена в R630 и R730. Эта проблема может возникнуть на всех серверах PowerEdge 13G с BIOS версии 2.3.x.