跳转至主要内容
  • 快速、轻松地下订单
  • 查看订单并跟踪您的发货状态
  • 创建并访问您的产品列表

Dell PowerEdge 13G - Possível reinicialização após "Erros de memória corrigíveis"

摘要: Como corrigir a reinicialização após a "Taxa de erro de memória corrigida excedida para DIMM_xx". em determinados servidores PowerEdge 13G

本文适用于 本文不适用于 本文并非针对某种特定的产品。 本文并非包含所有产品版本。

症状

O iDRAC registra o seguinte evento: Taxa de erro de memória corrigível mem0702 excedida para DIMM (banco/slot)

 

原因

Sumário

1. Descrição
2. Solução
3. Mais informações
 

 


Descrição

Um erro de memória corrigível é um erro de bit único que ocorre quando um bit muda erroneamente, de 1 para 0 ou de 0 para 1, durante uma operação de gravação ou leitura. Quando o bit específico em erro é identificado, o erro é corrigido complementando o bit errôneo. Os DIMMs certificados pela Dell executam essa correção automaticamente.
Em casos raros, um servidor pode reinicializar depois que um erro de memória corrigível é registrado no registro do SEL. Isso só é exibido na versão 2.3.x do BIOS.

Exemplo:

A taxa de erro de memória corrigível de advertência MEM0701 foi excedida por DIMM_xx.
A taxa de erro de memória corrigível essencial do MEM0702 foi excedida por DIMM_xx.


Exemplo de registro do LC:

2017-03-07 23:08:02 SYS1003 Reinicialização da CPU do sistema.
2017-03-07 23:08:02 O sistema SYS1001 está desligando.
2017-03-07 23:08:02 MEM0702 Taxa
de erro de memória corrigível excedida para DIMM_xx.
 

 

解决方案


Solução

Para resolver o problema de reinicialização, o BIOS deve ser atualizado para a versão mais atualizada. Se isso não for possível por motivos operacionais, o BIOS deve ser levado para as versões mínimas, conforme listado abaixo:

 
R430 2.4.2
T430 2.4.2
R530 2.4.2
T630 2.4.2
R630 2.4.3
R730 2.4.3
R830 1.4.2
C4130 2.4.2
C6320 2.4.2
Todos os blades modulares 2.4.2
Tabela 1: Versões e modelos relevantes do BIOS
 
SLN305799_en_US__1icon T130, R230, T330, R330 e R930 não são afetados por esse problema. 
SLN305799_en_US__1icon Se erros de memória corrigíveis ocorrerem após a atualização do BIOS, um processo de solução de problemas padrão deve ser implementado.

 


Mais informações

Esse problema foi relatado principalmente no PowerEdge R630 e R730, no entanto, o potencial existe em todo o 13G com uma versão do BIOS 2.3.x. Uma alteração foi introduzida na versão 2.3.x do BIOS para registro adicional no Banco de dados de política de segurança (SPD), que introduziu esse problema específico:

"Uma dereferencing de ponteiro NULO no registro SPD aprimorado do BIOS depois que o limite crítico de erro corrigível da memória for excedido, fará com que o sistema verifique ou trave a máquina."

As versões do BIOS cotadas anteriormente para as plataformas afetadas corrigirão o problema de reinicialização do servidor em conjunto com a mensagem de taxa de erro corrigível excedida.

O problema foi relatado principalmente no R630 e no R730.  O potencial existe em todos os servidores PowerEdge 13G com o BIOS versão 2.3.x para que o problema ocorra.

受影响的产品

PowerEdge c6320, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge R430, PowerEdge R530, PowerEdge R530xd, PowerEdge R630, PowerEdge R730 , PowerEdge R730xd, PowerEdge R830, PowerEdge R930, PowerEdge T630 ...
文章属性
文章编号: 000141221
文章类型: Solution
上次修改时间: 18 7月 2023
版本:  5
从其他戴尔用户那里查找问题的答案
支持服务
检查您的设备是否在支持服务涵盖的范围内。