iDRAC реєструє таку подію: MEM0702 Перевищено частоту помилок пам'яті, що виправляється, для DIMM (банк/слот)
1. Опис
2. Рішення
3. Додаткова інформація
Помилка пам'яті, яку можна виправити, - це однобітова помилка, яка виникає при біті, якщо він помилково змінюється, від 1 до 0 або від 0 до 1, під час операції запису або читання. Коли конкретний біт в помилці ідентифікований, помилка виправляється шляхом доповнення помилкового біта. Сертифіковані Dell DIMM виконують це виправлення автоматично.
У рідкісних випадках сервер може перезавантажитися після запису виправленої помилки пам'яті в журнал SEL. Це можна побачити тільки в BIOS версії 2.3.x.
Приклад:
Попередження MEM0701 Частота помилок пам'яті, що виправляється, перевищена для DIMM_xx.
MEM0702 Критичний коефіцієнт помилок пам'яті, що виправляється, перевищено для DIMM_xx.
Приклад журналу LC:
2017-03-07 23:08:02 Скидання системного процесора SYS1003.
2017-03-07 23:08:02 Система SYS1001 вимикається.
2017-03-07 23:08:02 MEM0702 Частота помилок пам'яті, що виправляється, перевищена для DIMM_xx.
Щоб вирішити проблему перезавантаження, BIOS слід оновити до найновішої версії. Якщо це неможливо з експлуатаційних причин, BIOS слід привести до мінімальних версій, як зазначено нижче:
R430 | 2.4.2 |
Т430 | 2.4.2 |
Р530 | 2.4.2 |
Т630 | 2.4.2 |
R630 | 2.4.3 |
R730 | 2.4.3 |
R830 | 1.4.2 |
C4130 | 2.4.2 |
C6320 | 2.4.2 |
Всі модульні лопаті | 2.4.2 |
Додаткова інформація
Про цю проблему в основному повідомлялося в PowerEdge R630 і R730, однак потенціал існує у всіх 13G з версією BIOS 2.3.x. У BIOS версії 2.3.x було внесено зміну для додаткового журналювання до бази даних політики безпеки (SPD), яка представила цю конкретну проблему:
"Покажчик NULL, який дереферує в розширеному журналі SPD BIOS після перевищення критичного порогу помилки, що виправляється пам'яттю, призведе до машинної перевірки або блокування системи".
Раніше цитовані версії BIOS для постраждалих платформ виправлять проблему перезавантаження сервера в поєднанні з перевищеним повідомленням про перевищення частоти помилок.
Про проблему в основному повідомлялося в R630 і R730. Потенціал існує на всіх серверах PowerEdge 13G з BIOS версії 2.3.x для виникнення проблеми.