跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表

Dell PowerEdge 13G - 在“可纠正内存错误”之后可能重新启动

摘要: 如何纠正某些特定 PowerEdge 13G 服务器在出现“DIMM_xx 可纠正内存错误率过高”的消息后重新启动的问题

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

iDRAC 记录以下事件:超过 DIMM(银行/插槽)的 MEM0702 可纠正内存错误率

 

原因

目录

1.描述
2.解决方案
3.更多信息
 

 


描述

可纠正内存错误是一种单位错误,如果在写入或读取操作过程中错误地将 1 更改为0 或将 0 更改为 1,就会出现这一错误。识别出错的特定单位后,可以通过补充错误单位的方式纠正错误。戴尔认证的 DIMM 将自动执行此纠正。
在极少数情况下,当 SEL 日志中记录可纠正的内存错误后,服务器可能会重新启动。这仅出现在 BIOS 版本 2.3.x 中。

示例:

MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable memory error rate exceeded for DIMM_xx.


LC 日志示例:

2017-03-07 23:08:02 SYS1003 System CPU Resetting.
2017-03-07 23:08:02 SYS1001 System is turning off.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

解决方案


解决方案

为解决重新启动问题,应将 BIOS 更新到最新版本。如果出于操作原因无法更新,应将 BIOS 设置为最低版本,如下所示:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
所有模块化刀片服务器 2.4.2
表 1:相关的 BIOS 版本和型号
 
SLN305799_en_US__1icon T130、R230、T330、R330 和 R930 不受此问题影响。 
SLN305799_en_US__1icon 如果 BIOS 更新后发生可纠正的内存错误,则应实施标准故障处理流程。

 


更多信息

此问题主要在 PowerEdge R630 和 R730 中报告过,但所有 BIOS 版本为 2.3.x 的 13G 服务器都可能出现此问题。2.3.x 版的 BIOS 进行了更改,以进行更多的安全策略数据库 (SPD) 日志记录,这样就引起此特定问题:

“超过内存可纠正错误的临界阈值后,BIOS 增强型 SPD 日志记录中的空指针取消引用会导致系统进行机器检查或锁定。”

前面引用的受影响平台的 BIOS 版本将修复服务器重新启动问题以及可纠正错误率过高的消息。

该问题主要在 R630 和 R730 中报告过。  所有 BIOS 版本为 2.3.x 的 PowerEdge 13G 服务器都可能存在这一问题。

受影响的产品

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
文章属性
文章编号: 000141221
文章类型: Solution
上次修改时间: 18 7月 2023
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。