Gå vidare till huvudinnehållet
  • Lägg beställningar snabbt och enkelt
  • Visa beställningar och kontrollera leveransstatus
  • Skapa och kom åt en lista över dina produkter

Feilsøke minnefeil på PowerEdge-systemer ved byttetesting

Sammanfattning: Bytte minne-DIMM-er for å feilsøke minnefeil på Dell Technologies PowerEdge-servere.

Den här artikeln gäller för   Den här artikeln gäller inte för 

Symptom

MERK: Denne artikkelen gjelder ikke for nyere systemer med Xeon Scalable Processor. For nyere systemer kan du sjekke denne artikkelen Hva er DDR4-selvreparasjon på Dell PowerEdge-servere med Intel Xeon Scalable-prosessorer?

Feilsøke minnefeil på PowerEdge-systemer ved byttetesting

Når en enkeltbitsfeil (SBE) og/eller flerbitsfeil (MBE) rapporteres på én eller flere DIMM-minneplasseringer, er det ikke sikkert at årsaken skyldes selve DIMM-en, så det må utføres enkel feilsøking for å finne ut nøyaktig hvor feilen ligger. Se figur 1 for et eksempel på minnefeil som oppstår i iDRAC-grensesnittet på en R715.

iDRAC 6-logger
Figur 1: Minnefeil som vist i iDRAC 6-logger (Bare på engelsk)

Isolering av minneproblemer betyr å bytte minne-DIMM-er til forskjellige minnekontakter, kanaler, banker og kontrollere. Det er flere måter du kan bytte DIMM-er rundt for å begrense feilen. Det kan hende du må bruke mer enn én av disse metodene for å finne feil DIMM eller sokkel. Nedenfor finner du en fremstilling av disse metodene. For å gjøre forklaringen enkel, antar vi at den defekte DIMM-en er A1 eller et av settene merket med blått på bildene.

Å bytte DIMM-er i grupper (etter kanal eller bank) i stedet for individuelt er den beste metoden for å identifisere de defekte DIMM- eller DIMM-ene.
Når en gruppe DIMM-er er identifisert til å inneholde de defekte DIMM-ene eller DIMM-ene, kan du bruke bevegelige DIMM-er til å identifisere hvilke DIMM-er som ikke har oppstått.


Fremgangsmåte 1:

Bytt ut DIMM A1 (merket med blått) med DIMM A9 (rødt) for å prøve DIMM i en annen minnekanal og bank


DIMM A1 til A9Figur 2: Bytte DIMM A1 med DIMM A9
 

Fremgangsmåte 2:

Hvis du bytter ut DIMM A1 (merket med blått) med DIMM B1 (merket med rødt), settes DIMM-en på en helt annen minnekontroller (CPU).

DIMM A1 til B1
Figur 3: Bytte DIMM A1 med DIMM B1
 

Fremgangsmåte 3:

Hvis du bytter ut hele banken med DIMM-er (A1, A2, A3 – merket blått) med en annen bank (B1, B2, B3 – merket rødt), testes hele banken med DIMM-er i en ny bank på en ny minnekontroller.

DIMMA 123 til B123
Figur 4: Bytte DIMM-ene A1, A2, A3 med DIMM-ene B1, B2 og B3
 

Fremgangsmåte 4

Hvis du bytter ut en hel kanal med DIMM-er (A1, A4, A7 – merket med blått) med en annen kanal (B1, B2, B3 – merket med rødt), tester du hele kanalen med DIMM-er i en ny kanal og på en ny minnekontroller.

DIMM A147 til B147
Figur 5: Bytte DIMM-ene A1, A4, A7 med DIMM-ene B1, B4 og B7
 

Tolke resultatene etter bytte av DIMM-er

Vanligvis har DIMM-feil en tendens til å følge DIMM-ene som er identifisert i feilene. For eksempel med en SBE-rapportering om DIMM A1, vil bytte denne DIMM-en med en annen DIMM fører til ett av følgende:

  1. Feilmeldingen rapporteres ikke lenger, og problemet er løst
  •   Dette indikerer at det løste problemet å ta ut minnet på nytt
  1. Feilmeldingen følger DIMM (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres nå mot DIMM B1)
  • Dette indikerer at DIMM-en mest sannsynlig mislyktes og må byttes ut.
  1. Feilmeldingen følger DIMM-kontakten (DIMM A1 byttes ut med DIMM B1, og feilmeldinger rapporteres fortsatt mot DIMM A1)
  • Dette indikerer at hovedkortet eller CPUen mest sannsynlig er feil
  • Bytte av CPU-er bekrefter hvilken komponent som må byttes ut
  • Hvis problemet følger CPU-en (feilmeldingen flyttes etter bytte av CPU-er), bytter du ut CPU-en
  • Bytt ut hovedkortet hvis problemet vedvarer i DIMM-kontakten
  1. Feilmeldingen følger ikke DIMM eller sokkelen (feilen rapporteres mot en annen DIMM etter bytte)
  • Dette indikerer at en annen DIMM eller DIMM mest sannsynlig er dårlig
 
MERK: Vi anbefaler deg også å holde fastvarenivåene oppdatert, da dette kan redusere risikoen for å motta minnefeil og forlenge levetiden til DIMM-ene.
Hvis du vil ha mer informasjon, kan du se følgende artikkel i Dells kunnskapsbase Dell Repository Manager (DRM).

Orsak

Ikke aktuelt

Upplösning

Ikke aktuelt

Berörda produkter

PowerEdge C1100, PowerEdge C2100, PowerEdge C5125, PowerEdge C5220, PowerEdge C5230, PowerEdge C6105, PowerEdge C6145, PowerEdge C6220, PowerEdge C6220 II, PowerEdge c6320

Produkter

PowerEdge c6320p, Poweredge FC430, Poweredge FC630, Poweredge FC830, PowerEdge M420, PowerEdge M520, PowerEdge M520 (for PE VRTX), PowerEdge M600, PowerEdge M605, PowerEdge M610, PowerEdge M610x, PowerEdge M620, PowerEdge M620 (for PE VRTX) , PowerEdge M630, PowerEdge M630 (for PE VRTX), PowerEdge M710, PowerEdge M710HD, PowerEdge M805, PowerEdge M820, PowerEdge M820 (for PE VRTX), PowerEdge M830, PowerEdge M830 (for PE VRTX), PowerEdge M905, PowerEdge M910, PowerEdge M915, PowerEdge R200, PowerEdge R210, PowerEdge R210 II, PowerEdge R220, PowerEdge R230, PowerEdge R300, PowerEdge R310, PowerEdge R320, PowerEdge R330, PowerEdge R410, PowerEdge R415, PowerEdge R420, PowerEdge R430, PowerEdge R510, PowerEdge R515, PowerEdge R520, PowerEdge R530, PowerEdge R530xd, PowerEdge R610, PowerEdge R620, PowerEdge R630, PowerEdge R710, PowerEdge R715, PowerEdge R720, PowerEdge R720XD, PowerEdge R730, PowerEdge R730xd, PowerEdge R805, PowerEdge R810, PowerEdge R815, PowerEdge R820, PowerEdge R830, PowerEdge R900, PowerEdge R905, PowerEdge R910, PowerEdge R920, PowerEdge R930, PowerEdge T100, PowerEdge T105, PowerEdge T110, PowerEdge T110 II, PowerEdge T130, PowerEdge T20, PowerEdge T30, PowerEdge T300, PowerEdge T310, PowerEdge T320, PowerEdge T330, PowerEdge T410, PowerEdge T420, PowerEdge T430, PowerEdge T605, PowerEdge T610, PowerEdge T620, PowerEdge T630, PowerEdge T710 ...