跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表
  • 使用“Company Administration”(公司管理),管理Dell EMC站点、产品和产品级联系人。

Dell PowerEdge 13G - 在“可纠正内存错误”之后可能重新启动

摘要: 如何纠正某些特定 PowerEdge 13G 服务器在出现“DIMM_xx 可纠正内存错误率过高”的消息后重新启动的问题

本文可能已自动翻译。如果您对其质量有任何反馈,请使用此页面底部的表单告知我们。

文章内容


症状

iDRAC 记录以下事件:超过 DIMM(银行/插槽)的 MEM0702 可纠正内存错误率

 

原因

目录

1.描述
2.解决方案
3.更多信息
 

 


描述

可纠正内存错误是一种单位错误,如果在写入或读取操作过程中错误地将 1 更改为0 或将 0 更改为 1,就会出现这一错误。识别出错的特定单位后,可以通过补充错误单位的方式纠正错误。戴尔认证的 DIMM 将自动执行此纠正。
在极少数情况下,当 SEL 日志中记录可纠正的内存错误后,服务器可能会重新启动。这仅出现在 BIOS 版本 2.3.x 中。

示例:

MEM0701 Warning Correctable memory error rate exceeded for DIMM_xx.
MEM0702 Critical Correctable memory error rate exceeded for DIMM_xx.


LC 日志示例:

2017-03-07 23:08:02 SYS1003 System CPU Resetting.
2017-03-07 23:08:02 SYS1001 System is turning off.
2017-03-07 23:08:02 MEM0702 Correctable memory error rate exceeded for DIMM_xx.

 

 

解决方案


解决方案

为解决重新启动问题,应将 BIOS 更新到最新版本。如果出于操作原因无法更新,应将 BIOS 设置为最低版本,如下所示:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
所有模块化刀片服务器 2.4.2
表 1:相关的 BIOS 版本和型号
 
SLN305799_en_US__1icon T130、R230、T330、R330 和 R930 不受此问题影响。 
SLN305799_en_US__1icon 如果 BIOS 更新后发生可纠正的内存错误,则应实施标准故障处理流程。

 


更多信息

此问题主要在 PowerEdge R630 和 R730 中报告过,但所有 BIOS 版本为 2.3.x 的 13G 服务器都可能出现此问题。2.3.x 版的 BIOS 进行了更改,以进行更多的安全策略数据库 (SPD) 日志记录,这样就引起此特定问题:

“超过内存可纠正错误的临界阈值后,BIOS 增强型 SPD 日志记录中的空指针取消引用会导致系统进行机器检查或锁定。”

前面引用的受影响平台的 BIOS 版本将修复服务器重新启动问题以及可纠正错误率过高的消息。

该问题主要在 R630 和 R730 中报告过。  所有 BIOS 版本为 2.3.x 的 PowerEdge 13G 服务器都可能存在这一问题。

文章属性


受影响的产品
PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
上次发布日期

18 7月 2023

版本

5

文章类型

Solution