Feilsøke minnefeil på PowerEdge-systemer ved byttetesting
Summary:Bytte minne-DIMM-er for å feilsøke minnefeil på Dell Technologies PowerEdge-servere.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Feilsøke minnefeil på PowerEdge-systemer ved byttetesting
Når en enkeltbitsfeil (SBE) og/eller flerbitsfeil (MBE) rapporteres på én eller flere DIMM-minneplasseringer, er det ikke sikkert at årsaken skyldes selve DIMM-en, så det må utføres enkel feilsøking for å finne ut nøyaktig hvor feilen ligger. Se figur 1 for et eksempel på minnefeil som oppstår i iDRAC-grensesnittet på en R715.
Figur 1: Minnefeil som vist i iDRAC 6-logger (Bare på engelsk)
Isolering av minneproblemer betyr å bytte minne-DIMM-er til forskjellige minnekontakter, kanaler, banker og kontrollere. Det er flere måter du kan bytte DIMM-er rundt for å begrense feilen. Det kan hende du må bruke mer enn én av disse metodene for å finne feil DIMM eller sokkel. Nedenfor finner du en fremstilling av disse metodene. For å gjøre forklaringen enkel, antar vi at den defekte DIMM-en er A1 eller et av settene merket med blått på bildene.
Å bytte DIMM-er i grupper (etter kanal eller bank) i stedet for individuelt er den beste metoden for å identifisere de defekte DIMM- eller DIMM-ene. Når en gruppe DIMM-er er identifisert til å inneholde de defekte DIMM-ene eller DIMM-ene, kan du bruke bevegelige DIMM-er til å identifisere hvilke DIMM-er som ikke har oppstått.
Fremgangsmåte 1:
Bytt ut DIMM A1 (merket med blått) med DIMM A9 (rødt) for å prøve DIMM i en annen minnekanal og bank
Figur 2: Bytte DIMM A1 med DIMM A9
Fremgangsmåte 2:
Hvis du bytter ut DIMM A1 (merket med blått) med DIMM B1 (merket med rødt), settes DIMM-en på en helt annen minnekontroller (CPU).
Figur 3: Bytte DIMM A1 med DIMM B1
Fremgangsmåte 3:
Hvis du bytter ut hele banken med DIMM-er (A1, A2, A3 – merket blått) med en annen bank (B1, B2, B3 – merket rødt), testes hele banken med DIMM-er i en ny bank på en ny minnekontroller.
Figur 4: Bytte DIMM-ene A1, A2, A3 med DIMM-ene B1, B2 og B3
Fremgangsmåte 4
Hvis du bytter ut en hel kanal med DIMM-er (A1, A4, A7 – merket med blått) med en annen kanal (B1, B2, B3 – merket med rødt), tester du hele kanalen med DIMM-er i en ny kanal og på en ny minnekontroller.
Figur 5: Bytte DIMM-ene A1, A4, A7 med DIMM-ene B1, B4 og B7
Tolke resultatene etter bytte av DIMM-er
Vanligvis har DIMM-feil en tendens til å følge DIMM-ene som er identifisert i feilene. For eksempel med en SBE-rapportering om DIMM A1, vil bytte denne DIMM-en med en annen DIMM fører til ett av følgende:
Feilmeldingen rapporteres ikke lenger, og problemet er løst
Dette indikerer at det løste problemet å ta ut minnet på nytt
Feilmeldingen følger DIMM (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres nå mot DIMM B1)
Dette indikerer at DIMM-en mest sannsynlig mislyktes og må byttes ut.
Feilmeldingen følger DIMM-kontakten (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres fortsatt mot DIMM A1)
Dette indikerer at hovedkortet eller CPUen mest sannsynlig er feil
Bytte av CPU-er bekrefter hvilken komponent som må byttes ut
Hvis problemet følger CPU-en (feilmeldingen flyttes etter bytte av CPU-er), bytter du ut CPU-en
Bytt ut hovedkortet hvis problemet vedvarer i DIMM-kontakten
Feilmeldingen følger ikke DIMM eller sokkelen (feilen rapporteres mot en annen DIMM etter bytte)
Dette indikerer at en annen DIMM eller DIMM mest sannsynlig er dårlig
MERK: Vi anbefaler deg også å holde fastvarenivåene oppdatert, da dette kan redusere risikoen for å motta minnefeil og forlenge levetiden til DIMM-ene.
Hvis du vil ha mer informasjon, kan du se følgende artikkel i Dells kunnskapsbase Dell Repository Manager (DRM).