메인 콘텐츠로 이동
  • 빠르고 간편하게 주문
  • 주문 보기 및 배송 상태 추적
  • 제품 목록을 생성 및 액세스
  • 회사 관리를 사용하여 Dell EMC 사이트, 제품 및 제품 수준 연락처를 관리하십시오.

Błędy EDAC w dzienniku „messages” w systemie RedHat Enterprise Linux (RHEL) i na serwerze PowerEdge

요약: Ten artykuł zawiera informacje na temat problemów z błędami EDAC w dzienniku „messages” w systemie RedHat Enterprise Linux (RHEL).

이 문서는 자동으로 번역되었을 수 있습니다. 번역 품질에 대한 의견이 있는 경우 페이지 하단의 양식을 사용해 알려 주시기 바랍니다.

문서 콘텐츠


증상

Problem: 

W dzienniku „/var/log/messages” może się pojawić następujący wpis:
 

Sep 22 17:58:47 hostname kernel: EDAC MC0: CE wiersz 0, kanał 0, etykieta "CPU_SrcID#0_Channel#1_DIMM#0": 1 Nieznane błędy: czyszczenie pamięci w obszarze FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f5000 => socket=0, Channel=1 (mask=2), rank=0Sep
22 17:58:47 nazwa_hosta jądro:
22 września 17:58:47 nazwa_hosta jądro: EDAC MC0: CE wiersz 1, kanał 0, etykieta "CPU_SrcID#0_Channel#2_DIMM#0": 1 Nieznane błędy: czyszczenie pamięci w obszarze FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE wiersz 1, kanał 0, etykieta "CPU_SrcID#0_Channel#2_DIMM#0": 1 Nieznane błędy: czyszczenie pamięci w obszarze FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f6000 => socket=0, Channel=2(mask=4), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 17:58:47 hostname kernel: EDAC MC0: CE wiersz 2, kanał 0, etykieta "CPU_SrcID#0_Channel#3_DIMM#0": 1 Nieznane błędy: czyszczenie pamięci w obszarze FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f7000 => socket=0, Channel=3 (mask=8), rank=0Sep
22 17:58:47 nazwa_hosta jądro:
22 września 17:58:47 nazwa_hosta jądro: EDAC MC0: CE wiersz 0, kanał 0, etykieta "CPU_SrcID#0_Channel#1_DIMM#0": 1 Nieznane błędy: czyszczenie pamięci w obszarze FATAL: cpu=0 Err=0008:00c2 (ch=2), addr = 0x1b63f8000 => socket=0, Channel=1(mask=2), rank=0Sep
22 17:58:47 hostname kernel:
Sep 22 18:00:08 hostname kernel: sbridge: OBSŁUGA BŁĘDÓW
PAMIĘCI MCE 22 18:00:08 nazwa_hosta: Procesor 0: Wyjątek sprawdzania komputera: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 nazwa hosta jądra: TSC 0 ADDR 2763f4000 MISC 900000800081a8c 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: mostek: OBSŁUGA BŁĘDÓW
PAMIĘCI MCE 22 18:00:08 nazwa_hosta: Procesor 0: Wyjątek sprawdzania komputera: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 nazwa hosta jądra: PROCESOR TSC 0 ADDR 2763f4000 MISC 900002000201a8c 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: mostek: OBSŁUGA BŁĘDÓW
PAMIĘCI MCE 22 18:00:08 nazwa_hosta: Procesor 0: Wyjątek sprawdzania komputera: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 nazwa hosta jądra: PROCESOR TSC 0 ADDR 2763f4000 MISC 900000400041a8c 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: mostek: OBSŁUGA BŁĘDÓW
PAMIĘCI MCE 22 18:00:08 nazwa_hosta: Procesor 0: Wyjątek sprawdzania komputera: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 nazwa hosta jądra: PROCESOR TSC 0 ADDR 2763f4000 MISC 900000400041a8c 0:206d7 TIME 1379887208 SOCKET 0 APIC 0Sep
22 18:00:08 hostname kernel: mostek: OBSŁUGA BŁĘDÓW
PAMIĘCI MCE 22 18:00:08 nazwa_hosta: Procesor 0: Wyjątek sprawdzania komputera: 0 Bank 10: 8c00004d000800c2Sep
22 18:00:08 nazwa hosta jądra: PROCESOR TSC 0 ADDR 2763f5000 MISC 900001000101a8c 0:206d7 CZAS 1379887208 SOCKET 0 APIC 0

 

원인

Omówienie:
 
Błędy te występują, gdy moduł wykrywania i korekcji błędów (EDAC) odczytuje rejestry z chipsetu. Błędy modułów pamięci lub procesorów w dzienniku ESM/BMC/IPMI/iDRAC mogą być niezauważone, ponieważ rejestry są odczytywane jednokrotnie i po włączeniu EDAC odczytuje je w pierwszej kolejności.

 

해결

Rozwiązanie:

 

  • Wpisz sterownik edac na listę zabronionych:
    • Wyświetl moduły EDAC:
      • # lsmod | grep -i edac
    • Sprawdź wynik i wpisz na listę zabronionych następujące dane:
    • Edytuj „/etc/modprobe.d/blacklist.conf” z użyciem preferowanego edytora
    • Dodaj moduły na końcu pliku
    • Przykład:
      • blacklist i7core_edac
      • blacklist edac_core
  • Ponowne uruchomienie
  • Uruchom diagnostykę sprzętu

 

문서 속성


영향을 받는 제품

Servers, PowerEdge, Software RAID with Red Hat Enterprise Linux4, Red Hat Enterprise Linux Version 5, Red Hat Enterprise Linux Version 6, Red Hat Enterprise Linux Version 7, Red Hat Enterprise Virtualization 3

마지막 게시 날짜

25 6월 2024

버전

6

문서 유형

Solution