Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

14G Intel ja 15G Intel / AMD PowerEdge -palvelimet: DDR4-muisti: korjattavissa olevien virhekynnystapahtumien hallinta

Summary: Päivitetyt suositukset asiakkaille korjattavissa olevien virheiden kynnystapahtumien (MEM0802 tai MEM5104) hallintaan DDR4 RDIMM- tai LRDIMM-moduuleissa, jotka on asennettu Intelin 14G- ja 15G PowerEdge -palvelimiin sekä AMD-pohjaisiin 15G PowerEdge -palvelimiin. Huomautus: Tämä artikkeli ei koske 14G-AMD-pohjaisia PowerEdge-palvelimia, kuten 64x5- tai 74x5-ympäristöjä, koska niissä ei ole tätä Post Package Repair / self healing -ominaisuutta, vaikka DIMM-kampa itsessään tukee sitä. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Yritysluokan muistin RAS-ominaisuuksien (Reliability, Accessibility and Serviceability) kehittymisen myötä Dell on ottanut konservatiivisen lähestymistavan virheraportointiin tarjotakseen asiakkaille läpinäkyvyyttä. Tämän kehityksen jatkuessa myös Dellin lähestymistapa virheiden raportointiin muuttuu, jotta se voi keskittyä ilmoituksiin, jotka edellyttävät kiireellisempää vastausta, verrattuna ilmoituksiin, jotka ovat luonteeltaan ensisijaisesti informatiivisia.

Koska DRAM-pohjaisten muistigeometrioiden määrä pienenee jatkuvasti, mikä tarjoaa asiakkaille heidän tarvitsemansa paremman suorituskyvyn, yhä useamman korjattavissa olevan virheen odotetaan olevan luonnollinen osa yhtenäistä skaalausta.

Cause

Maailmanlaajuisella palvelinalalla ymmärretään yhä laajemmin, että Dell ymmärtää yhä laajemmin, että jotkin DIMM-moduulikohtaiset korjattavissa olevat virheet ovat väistämättömiä eivätkä sinänsä edellytä muistimoduulin vaihtamista tai edes välitöntä uudelleenkäynnistystä itsekorjauksen aloittamiseksi.

Resolution

Korjattavissa olevista virheistä ilmoittavan järjestelmän käytön jatkaminen ilman uudelleenkäynnistystä tai itsekorjausta ei merkittävästi lisää korjauskelvottomien virheiden riskiä, jotka voivat johtaa suunnittelemattomiin seisokkeihin. Itse asiassa muut alan toimijat ovat julkisesti ilmoittaneet, että muistin käsittely ei ilmoita korjattavissa olevista virheistä.

14G Intel PowerEdge BIOS -versioon 2.5.4 ja uudempiin lisättiin BIOS-asetus nimeltä "Correctable Error Logging", jotta asiakkaat voivat halutessaan poistaa korjattavissa olevien virheiden raportoinnin käytöstä, kuten monet ovat tehneet.  BIOS ajoittaa korjattavissa olevien kynnystapahtumien itsekorjauksen myös ilman kirjaamista. Tämä ajoitettu itsekorjaus tapahtuu automaattisesti seuraavan järjestelmän uudelleenkäynnistyksen yhteydessä.

Dell PowerEdgen BIOS-päivitykset muuttavat maaliskuusta 2022 alkaen Correctable Error Logging -BIOS-asetuksen oletusarvoisesti pois käytöstä, jotta ala ja jatkuva asiakaspalaute vastaavat paremmin toisiaan.  Tämä BIOS-vaihtoehto voidaan ottaa uudelleen käyttöön, jos asiakkaat haluavat edelleen nähdä korjattavissa olevat muistin kynnystapahtumat. Tämä BIOS-asetusten muutos sisältää seuraavat BIOS-versiot:
  • 14G-Intel-alustat – BIOS-versio 2.13.3 tai uudempi
  • 15G AMD -alustat – BIOS-versio 2.6.5 tai uudempi
  • 15G-Intel-alustat – BIOS-versio 1.5.5 tai uudempi.

DDR4 DIMM -itsekorjauksen edut järjestelmän uudelleenkäynnistyksen yhteydessä:
  • Mahdollistaa DDR4 DIMM -moduulin korjauksen poistamatta sitä järjestelmästä. Kaikki Dellin DDR4 DIMM -moduulit tukevat muistin itsekorjausta. Huomautus - 14G AMD PowerEdge -palvelimissa ei ole tätä itsekorjautuvaa ominaisuutta.
  • Hyödyntää DRAM-muistiin suunniteltuja käytettävissä olevia vararivejä, joissa huono rivi korvataan pysyvästi hyväksi tiedetyllä rivillä sähköisellä sulakkeella.
  • Seuraava muistin uudelleenkoulutus optimoi "datasilmät" kalibroimalla keskipisteet uudelleen sen varmistamiseksi, että muistiväylä toimii signaalin eheyden korkeimmalla tasolla.


Jos muistin kynnystapahtumat ovat korjattavissa ja BIOS on käytössä Correctable Error Logging -asetuksella, Dell suosittelee muistin kynnysarvon tapahtumien käynnistämistä uudelleen asiakkaan normaalin ylläpitoaikataulun mukaisesti, jotta ajoitettu muisti voi korjautua tai korjautua. Uudelleenkäynnistyksen jälkeen onnistuneita tai epäonnistuneita itsekorjaustapahtumia kirjataan liitetyille DIMM-moduuleille.

Kun BIOSin Correctable Error Logging -asetus on Disable, Dell suosittelee uudelleenkäynnistystä asiakkaan normaalin ylläpitoaikataulun mukaisesti. Uudelleenkäynnistyksen yhteydessä kaikki ajoitetut itsekorjaustoiminnot suoritetaan automaattisesti. Järjestelmä kirjaa tapahtuman (MEM0805- tai MEM7114-tyyppisen tapahtuman), jos itsekorjaus ei onnistunut, ja suosittelee lisäksi viallisen DIMM-moduulin fyysistä vaihtamista.

Suositus:
Dell EMC Memory Engineering suosittelee, että PowerEdge Server -asiakkaat, jotka käyttävät vanhempia BIOS-versioita (ennen maaliskuun lohkoa 2022 julkaistut BIOS-versiot), ottavat käyttöön Correctable Error Logging -asetuksen muuttamisen pois käytöstä. Tämä poistaa satunnaiset korjattavissa olevat muistikynnystapahtumat (kuten MEM0802- tai MEM5104 tyyppiset tapahtumat) koko palvelininfrastruktuurissa, jotka suosittelevat palvelimen uudelleenkäynnistystä itsekorjauksen tai itsekorjauksen mahdollistamiseksi. Kuten aiemmin mainittiin, kaikki ajoitetut itsekorjaus- tai itsekorjaustoiminnot suoritetaan automaattisesti, kun palvelin käynnistetään uudelleen, ja kaikista virheistä ilmoitetaan.
 

BIOSin Correctable Error Logging -asetusta voi muuttaa joko käynnistämällä palvelimen uudelleen F2-asetuksiin tai iDRAC-käyttöliittymässä.
 

BIOS-asetuksen muuttaminen F2-asetuksissa:

  • Käynnistä palvelimet uudelleen pysähtyen F2-asetuksiin
  • Muuta BIOS-asetukset -> Muistiasetukset -valinnassa "Korjattavissa olevien virheiden kirjaaminen" -asetukseksi pois käytöstä.
  • Tallenna BIOS-asetukset ja poistu F2-asetuksista

BIOS-asetuksen muuttaminen iDRAC-käyttöliittymässä:

  • Kirjaudu iDRAC-käyttöliittymään
  • Laajenna Configuration -> BIOS Settings -kohdassa Memory Settings (Muistiasetukset)
  • Vaihda Correctable Error Logging -asetukseksi disabled
  • Tallenna muistiasetukset valitsemalla Apply-painike
  • Ota BIOS-muutokset käyttöön valitsemalla joko Käytä ja käynnistä uudelleen -painike (käynnistääksesi heti uudelleen) tai Seuraava uudelleenkäynnistys -painike .


Nykyiset muistiin liittyvät tietämyskannan artikkelit ja tekniset raportit päivitetään vastaamaan tätä suositeltua muutosta.

HUOMAUTUS: Hyväksytty asiakkaille suunnattu viestintä on liitetty tiedostona tähän artikkeliin "Korjattavissa olevien virheilmoitusten hallinta joulukuu 2021 v1.pdf".

Tätä artikkelia päivitetään, kun uutta tietoa tulee saataville.

Affected Products

AX-6515, AX-7525, Dell EMC vSAN C6420 Ready Node, Dell EMC vSAN MX740c Ready Node, Dell EMC vSAN R440 Ready Node, Dell EMC vSAN R640 Ready Node, Dell EMC vSAN R650 Ready Node, Dell EMC vSAN R6515 Ready Node, Dell EMC vSAN R740 Ready Node , Dell EMC vSAN R740xd Ready Node ...

Products

Dell EMC XC Series XC6420 Appliance, Dell EMC XC Core 6420 System, Storage Spaces Direct R440 Ready Node, Storage Spaces Direct R640 Ready Node, Storage Spaces Direct R740xd Ready Node, Storage Spaces Direct R740xd2 Ready node, OEMR R340, OEMR R440 , PowerEdge XR2, OEMR R540, OEMR R640, OEMR XL R640, OEMR R650, OEMR R650xs, OEMR R6515, OEMR R6525, OEMR R740, OEMR XL R740, OEMR R740xd, OEMR XL R740xd, OEMR R740xd2, OEMR R750, OEMR R750xa, OEMR R750xs, OEMR R7515, OEMR R7525, OEMR R840, OEMR R940, OEMR R940xa, OEMR T440, OEMR T550, OEMR T640, OEMR XL T640, OEMR XL R340, PowerEdge C6420, PowerEdge C6525, PowerEdge MX740C, PowerEdge MX840C, PowerEdge R340, PowerEdge R540, PowerEdge R640, PowerEdge R650, PowerEdge R650xs, PowerEdge R6515, PowerEdge R6525, PowerEdge R740, PowerEdge R740XD, PowerEdge R740XD2, PowerEdge R750, PowerEdge R750XA, PowerEdge R750xs, PowerEdge R7515, PowerEdge R7525, PowerEdge R840, PowerEdge R940, PowerEdge R940xa, PowerEdge T440, PowerEdge T550, PowerEdge T640, PowerFlex appliance R650, PowerFlex appliance R6525, Powerflex appliance R750, PowerFlex custom node R650, PowerFlex custom node R6525, PowerFlex custom node R750, VxFlex Ready Node R640, VxFlex Ready Node R740xd, Dell EMC vSAN R750 Ready Node, Dell EMC vSAN R7515 Ready Node, Dell EMC vSAN R840 Ready Node, PowerFlex appliance R640, PowerFlex appliance R740XD, PowerFlex appliance R840, VxFlex Ready Node R840, Dell EMC XC Core XC7525 ...
Article Properties
Article Number: 000194574
Article Type: Solution
Last Modified: 10 Feb 2022
Version:  2
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.