Summary:Dell Technologies PowerEdge 서버에서 메모리 오류를 해결하기 위해 메모리 DIMM을 교체합니다.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
하나 이상의 메모리 DIMM 위치에서 SBE(Single Bit Error) 및/또는 MBE(Multi-Bit Error)가 보고되면 원인이 DIMM 자체에 있지 않을 수 있으므로 몇 가지 간단한 문제 해결을 수행하여 정확히 어디에 결함이 있는지 확인해야 합니다. R715의 iDRAC 인터페이스에 나타나는 메모리 오류의 예는 그림 1 을 참조하십시오.
그림 1 : iDRAC 6 로그에 표시된 메모리 오류 (영어로만 제공)
메모리 문제를 격리한다는 것은 메모리 DIMM을 다른 메모리 소켓, 채널, 뱅크 및 컨트롤러로 교체하는 것을 의미합니다. DIMM을 교체하여 결함 범위를 좁힐 수 있는 몇 가지 방법이 있습니다. 결함이 있는 DIMM 또는 소켓을 찾아내기 위해 이러한 방법 중 두 가지 이상을 사용해야 할 수도 있습니다. 아래에서 이러한 방법의 표현을 찾을 수 있습니다. 설명을 간단하게 하기 위해, 결함이 있는 DIMM이 A1이거나 이미지에서 파란색으로 표시된 세트 중 하나라고 가정합니다.
장애가 발생한 DIMM 또는 DIMM을 식별하는 가장 좋은 방법은 장애가 발생한 DIMM을 식별하는 가장 좋은 방법입니다( 채널 또는 뱅크별).장애가 발생한 DIMM을 포함하도록 DIMM 그룹이 식별되면 단일 DIMM을 이동하여 장애가 발생한 DIMM을 식별할 수 있습니다.
방법 1:
DIMM A1(파란색으로 표시)을 DIMM A9(빨간색으로 표시)로 바꾸어 다른 메모리 채널과 뱅크에서 DIMM을 테스트합니다.
그림 2: DIMM A1을 DIMM A9로 바꿉니다.
방법 2:
DIMM A1(파란색으로 표시)을 DIMM B1(빨간색으로 표시)으로 바꾸면 DIMM이 전혀 다른 CPU(Memory Controller)에 배치됩니다.
그림 3 : DIMM A1을 DIMM B1로 바꿉니다.
방법 3:
전체 DIMM 뱅크(A1, A2, A3 - 파란색으로 표시)를 다른 뱅크(B1, B2, B3 - 빨간색으로 표시)로 교체하면 새 메모리 컨트롤러의 새 뱅크에서 전체 DIMM 뱅크가 테스트됩니다.
그림 4 : DIMM A1, A2, A3를 DIMM B1, B2, B3으로 바꿉니다.
방법 4
전체 DIMM 채널(A1, A4, A7 - 파란색으로 표시)을 다른 채널(B1, B2, B3 - 빨간색로 표시)로 교체하여 새 채널 및 새 메모리 컨트롤러에서 전체 채널의 DIMM을 테스트합니다.
그림 5 : DIMM A1, A4, A7을 DIMM B1, B4, B7로 바꿉니다.
DIMM 교체 후 결과 해석
일반적으로 DIMM 오류는 오류에서 식별된 DIMM을 따르는 경향이 있습니다. 예를 들어 SBE가 DIMM A1에 대해 보고하는 경우 이 DIMM을 다른 DIMM으로 교체하면 다음 중 하나가 발생합니다.
오류 메시지가 더 이상 보고되지 않고 문제가 해결되었습니다
메모리를 다시 장착해 문제가 해결되었음을 나타냅니다.
DIMM 다음에 오류 메시지가 나타납니다(DIMM A1은 DIMM B1로 교체되고 오류 메시지는 이제 DIMM B1에 대해 보고됩니다).
이는 DIMM에 장애가 발생할 가능성이 가장 높으므로 교체해야 함을 나타냅니다.
DIMM 소켓 다음에 오류 메시지가 나타납니다(DIMM A1은 DIMM B1로 교체되고 오류 메시지는 여전히 DIMM A1에 대해 보고됩니다).
이는 시스템 보드 또는 CPU에 오류가 있을 가능성이 높음을 나타냅니다.
CPU 교체를 통해 교체가 필요한 구성 요소 확인
CPU에서 문제가 발생하는 경우(CPU를 교체한 후 오류 메시지가 이동함) CPU를 교체합니다
문제가 DIMM 소켓에서 지속되면 시스템 보드를 교체합니다
오류 메시지가 DIMM 또는 소켓을 따르지 않습니다(교체 후 다른 DIMM에 대해 오류가 보고됨).
이는 다른 DIMM 또는 DIMM이 불량일 가능성이 높다는 것을 나타냅니다.
참고: 또한 펌웨어 수준을 최신으로 유지하면 메모리 오류 수신 위험을 줄이고 DIMM의 수명을 연장할 수 있습니다.
자세한 내용은 Dell 기술 자료 문서 DRM(Dell Repository Manager)을 참조하십시오.