메인 콘텐츠로 이동
  • 빠르고 간편하게 주문
  • 주문 보기 및 배송 상태 추적
  • 제품 목록을 생성 및 액세스
  • 회사 관리를 사용하여 Dell EMC 사이트, 제품 및 제품 수준 연락처를 관리하십시오.

RedHat Enterprise Linux(RHEL)およびPowerEdgeRedの「messages」ログに発生するEDACエラー

요약: この文書では、RedHat Enterprise Linux(RHEL)の「messages」ログに発生するEDACエラーに関する問題について説明します。

이 문서는 자동으로 번역되었을 수 있습니다. 번역 품질에 대한 의견이 있는 경우 페이지 하단의 양식을 사용해 알려 주시기 바랍니다.

문서 콘텐츠


증상

現象:

「/var/log/messages」ログに次のような内容が表示されることがあります。
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行0、チャネル0、ラベル「CPU_SrcID#0_Channel#1_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f5000 => socket=0、Channel=1(mask=2)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行1、チャネル0、ラベル「CPU_SrcID#0_Channel#2_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f6000 => socket=0、Channel=2(mask=4)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行1、チャネル0、ラベル「CPU_SrcID#0_Channel#2_DIMM#0」: 1 不明なエラー: FATAL領域でのメモリー スクラブ :cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f6000 => socket=0、Channel=2(mask=4)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行2、チャネル0、「CPU_SrcID#0_Channel#3_DIMM#0」というラベルを付けます。1 不明なエラー:致命的領域でのメモリー スクラブ:cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f7000 => socket=0、Channel=3(mask=8)、rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE行0、チャネル0、ラベル「CPU_SrcID#0_Channel#1_DIMM#0」: 1 不明なエラー:FATAL領域でのメモリー スクラブ:cpu=0 Err=0008:00c2(ch=2)、addr = 0x1b63f8000 => socket=0、 Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 90000080081a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900002000201a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900000400041a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f4000 MISC 900000400041a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: sbridge: MCEメモリー エラー
の処理 22 18:00:08ホスト名カーネル: CPU 0: マシン チェック例外: 0 Bank 10: 8c00004d000800c2Sep 22
18:00:08ホスト名カーネル: TSC 0 ADDR 2763f5000その他900001000101a8cプロセッサー0:206d7 TIME 1379887208 SOCKET 0 APIC 0

 

원인

ディスカッション:

これらのエラーは、エラー検出および修正(EDAC)モジュールがチップセットからレジスターを読み取ったときに発生します。ESM/BMC/IPMI/iDRACログではメモリーまたはCPUのエラーは見られない可能性があります。これは、レジスターは1回だけ読み取られ、有効になると、EDACが最初にそれらを取得するためです。

 

해결

解決策:

 

  • 以下の手順を実行して、edacドライバーをブラックリストに追加します。
    • edacモジュールを一覧表示します。
      • # lsmod | grep -i edac
    • 出力結果をブラックリストに追加します。
    • 任意のエディターを使用して「/etc/modprobe.d/blacklist.conf」を編集します。
    • モジュールをファイル末尾に追加します。
    • 例:
      • blacklist i7core_edac
      • blacklist edac_core
  • 再起動
  • ハードウェアDiagnostics(診断)の実行

 

문서 속성


영향을 받는 제품

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

마지막 게시 날짜

25 6월 2024

버전

6

문서 유형

Solution