メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能
  • 「Company Administration(会社情報の管理)」では、お使いのDell EMCのサイトや製品、製品レベルでのコンタクト先に関する情報を管理できます。

RHEL(RedHat Enterprise Linux) 및 PowerEdge의 'messages' 로그 EDAC 오류

概要: 이 문서에서는 RHEL(RedHat Enterprise Linux)의 'messages' 로그 EDAC 오류 문제에 대한 정보를 제공합니다.

この記事は自動翻訳されたものである可能性があります。品質に関するフィードバックがある場合は、このページの下部にあるフォームを使用してお知らせください。

文書の内容


現象

문제: 

'/var/log/messages' 로그에 다음과 같은 내용이 표시될 수 있습니다.
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f5000 => 소켓=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 1, 채널 0, 레이블 "CPU_SrcID#0_Channel#2_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 2, 채널 0, 레이블 "CPU_SrcID#0_Channel#3_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f7000 => socket=0, Channel=3(mask=8), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 17:58:47 호스트 이름 커널: EDAC MC0: CE 행 0, 채널 0, 레이블 "CPU_SrcID#0_Channel#1_DIMM#0": 1 알 수 없는 오류: 치명적인 영역에서 메모리 스크러빙: cpu=0 Err=0008:00c2(ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
9월 22일 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000080081a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 9000020002001a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f4000 MISC 90000040041a8c 프로세서 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 호스트 이름 커널: sbridge: MCE 메모리 오류
처리 22년 9월 22일 18:00:08 호스트 이름 커널: CPU 0: 시스템 검사 예외: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 호스트 이름 커널: TSC 0 ADDR 2763f5000 MISC 900001000101a8c 프로세서 0:206d7 시간 1379887208 소켓 0 APIC 0

 

原因

설명:
 
이러한 오류는 EDAC(Error Detection and Correction) 모듈이 칩셋에서 레지스터를 읽을 때 발생합니다. 레지스터는 한 번만 읽히고 활성화될 때 EDAC에서 먼저 가져오므로 ESM/BMC/IPMI/iDRAC 로그에서 메모리 또는 CPU 오류를 발견하지 못할 수도 있습니다.

 

解決方法

해결 방법:

 

  • edac 드라이버 차단 목록 작성:
    • edac 모듈 나열:
      • # lsmod | grep -i edac
    • 출력 확보 및 차단 목록 작성
    • 자신이 원하는 편집기로 '/etc/modprobe.d/blacklist.conf' 편집
    • 파일 하단에 모듈 추가
    • 예:
      • blacklist i7core_edac
      • blacklist edac_core
  • 재부팅
  • 하드웨어 진단 실행

 

文書のプロパティ


影響を受ける製品

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

最後に公開された日付

25 6月 2024

バージョン

6

文書の種類

Solution