メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能
  • 「Company Administration(会社情報の管理)」では、お使いのDell EMCのサイトや製品、製品レベルでのコンタクト先に関する情報を管理できます。

RedHat Enterprise Linux (RHEL) 和 PowerEdge 上的 'messages’ 日志中的 EDAC 错误

概要: 本文提供了有关在 RedHat Enterprise Linux (RHEL) 中的 'messages' 日志中的 EDAC 错误的信息。

この記事は自動翻訳されたものである可能性があります。品質に関するフィードバックがある場合は、このページの下部にあるフォームを使用してお知らせください。

文書の内容


現象

问题:

您可能会在 '/var/log/messages' 日志中看到以下类似内容:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f5000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 1,通道 0,标签“CPU_SrcID#0_Channel#2_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f6000 => 插槽=0, 通道 =2(mask=4),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 2,通道 0,标签“CPU_SrcID#0_Channel#3_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f7000 => 插槽=0, 通道 =3(mask=8),rank=0Sep
22 17:58:47 主机名内核:
9 月 22 日 17:58:47 主机名内核:EDAC MC0:CE 行 0,通道 0,标签“CPU_SrcID#0_Channel#1_DIMM#0”:1 未知错误:致命区域上的内存清理:cpu=0 Err=0008:00c2 (ch=2),addr = 0x1b63f8000 => 插槽=0, Channel=1(mask=2),rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000800081a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900002000201a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f4000 MISC 900000400041a8c 处理器 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 主机名内核:sbridge:处理 MCE 内存错误
22 18:00:08 主机名内核:CPU 0:机器检查异常:0 Bank 10:8c00004d000800c2Sep
22 18:00:08 主机名内核:TSC 0 ADDR 2763f5000 MISC 9000010001a8c 处理器 0:206d7 时间1379887208插槽 0 APIC 0

 

原因

讨论:

当错误检测和纠正 (EDAC) 模块从芯片组读取寄存器时,就会出现这些错误。您可能不会在 ESM/BMC/IPMI/iDRAC 日志中看到任何内存或 CPU 错误,因为寄存器为只读,并且在启用后,EDAC 将首先获得它们。

 

解決方法

解决方案:

 

  • 将 edac 驱动程序列入黑名单:
    • 列出 edac 模块:
      • # lsmod | grep -i edac
    • 获取输出并将其列入黑名单:
    • 使用您喜欢的编辑器来编辑 '/etc/modprobe.d/blacklist.conf'
    • 将模块添加到文件底部
    • 示例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 重新 启动
  • 运行硬件诊断程序

 

文書のプロパティ


影響を受ける製品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

最後に公開された日付

25 6月 2024

バージョン

6

文書の種類

Solution