Geheugenfouten op PowerEdge systemen oplossen door middel van swaptests
Résumé:Geheugen-DIMM's omwisselen om geheugenfouten op Dell Technologies PowerEdge servers op te lossen.
Sélectionnez un produit pour vérifier la pertinence de l’article
Cet article concerne Cet article ne concerne pasCet article n’est associé à aucun produit spécifique.Toutes les versions du produit ne sont pas identifiées dans cet article.
Geheugenfouten op PowerEdge systemen oplossen door middel van swaptests
Wanneer een single-bit error (SBE) en/of multi-bit error (MBE) wordt gemeld op een of meer geheugen-DIMM-locaties, ligt de oorzaak mogelijk niet bij de DIMM zelf, dus moet er een eenvoudige probleemoplossing worden uitgevoerd om te bepalen waar de fout precies ligt. Zie afbeelding 1 voor een voorbeeld van geheugenfouten in de iDRAC-interface van een R715.
Figuur 1: Geheugenfouten zoals weergegeven in iDRAC 6-logboeken (alleen In het Engels)
Het isoleren van geheugenproblemen betekent het verwisselen van geheugen-DIMM's naar verschillende geheugensockets, -kanalen, -banken en -controllers. Er zijn verschillende manieren waarop u de DIMM's kunt verwisselen om de fout vast te stellen. Mogelijk moet u meer dan één van deze methoden gebruiken om de defecte DIMM of socket te lokaliseren. Hieronder vindt u een weergave van deze methoden. Om de uitleg duidelijk te maken, gaan we ervan uit dat de defecte DIMM A1 is of een van de sets die in de afbeeldingen blauw zijn gemarkeerd.
Het verwisselen van DIMM's in groepen (per kanaal of bank) in plaats van afzonderlijk is de beste methode om de defecte DIMM of DIMM's te identificeren. Zodra een groep DIMM's is geïdentificeerd die de defecte DIMM of DIMM's bevat, kunnen verplaatste enkele DIMM's worden gebruikt om te identificeren welke DIMM's defect zijn.
Methode 1:
DIMM A1 (blauw gemarkeerd) vervangen door DIMM A9 (rood gemarkeerd) om de DIMM in een ander geheugenkanaal en een andere bank
uit te proberenAfbeelding 2: DIMM A1 vervangen door DIMM A9
Methode 2:
Als u DIMM A1 (blauw gemarkeerd) verwisselt met DIMM B1 (rood gemarkeerd), wordt de DIMM op een geheel andere geheugencontroller (CPU) geplaatst.
Figuur 3: DIMM A1 vervangen door DIMM B1
Methode 3:
Wanneer u de hele bank met DIMM's (A1, A2, A3 - gemarkeerd als blauw) verwisselt met een andere bank (B1, B2, B3 - gemarkeerd met rood), wordt de hele bank met DIMM's in een nieuwe bank op een nieuwe geheugencontroller getest.
Figuur 4: DIMM's A1, A2, A3 vervangen door DIMM's B1, B2, B3
Methode 4
Verwissel een heel kanaal met DIMM's (A1, A4, A7 - gemarkeerd als blauw) met een ander kanaal (B1, B2, B3 - rood gemarkeerd) en test het hele kanaal met DIMM's in een nieuw kanaal en op een nieuwe geheugencontroller.
Figuur 5: DIMM's A1, A4, A7 vervangen door DIMM's B1, B4, B7
De resultaten interpreteren na het verwisselen van DIMM's
Over het algemeen volgen DIMM-fouten de DIMM's die in de fouten worden geïdentificeerd. Als een SBE bijvoorbeeld rapporteert over DIMM A1, resulteert het verwisselen van deze DIMM door een andere DIMM in een van de volgende situaties:
De foutmelding wordt niet langer gemeld en het probleem is opgelost
Dit geeft aan dat het probleem is opgelost door het geheugen opnieuw te plaatsen
Het foutbericht volgt op de DIMM (DIMM A1 is verwisseld met DIMM B1 en foutmeldingen worden nu gerapporteerd tegen DIMM B1)
Dit geeft aan dat de DIMM hoogstwaarschijnlijk defect is en moet worden vervangen.
De foutmelding volgt op de DIMM-socket (DIMM A1 is verwisseld met DIMM B1 en foutmeldingen worden nog steeds gerapporteerd tegen DIMM A1)
Dit wijst erop dat de systeemkaart of CPU hoogstwaarschijnlijk defect is
CPU's wisselen bevestigt welk onderdeel moet worden vervangen
Als het probleem zich voordoet bij de CPU (de foutmelding wordt verplaatst na het verwisselen van CPU's), vervangt u de CPU
Als het probleem bij de DIMM-socket blijft, moet u de systeemkaart vervangen
De foutmelding volgt de DIMM of de socket niet (de fout wordt gemeld tegen een andere DIMM na het verwisselen)
Dit geeft aan dat een andere DIMM of DIMM's hoogstwaarschijnlijk slecht is
OPMERKING: We raden u aan om ook uw firmwareniveaus up-to-date te houden, omdat dit het risico op geheugenfouten kan verminderen en de levensduur van de DIMM's kan verlengen.
Raadpleeg voor meer informatie het Dell Knowledge Base-artikel Dell Repository Manager (DRM).