Omgaan met Puncturing (Bad Blocks) op virtuele schijven voor PowerEdge servers

Summary: stappen voor probleemoplossing van slechte blokken (punctures) op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Symptoms

Cause

Resolution

Dit artikel bevat stappen voor probleemoplossing voor (puncturing) slechte blokken op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status.

1. Omschrijving storing

Fout nr. 1:

De OpenManage Server Administrator (OMSA) toont een rood kruisje voor een virtuele schijf (afbeelding 1).

SLN111146_en_US__11343098652871.1
Afbeelding 1: Virtuele schijf met rood kruis in status (voorbeeld H800)

Opmerking: Dell OpenManage Server Administrator (OMSA) biedt een complete, één-op-één oplossing voor systeembeheer. OMSA kan worden gecategoriseerd in twee applicaties:
- Geïntegreerd - Web browser-based Graphical User Interface (GUI) - Command
Line Interface (CLI) - Via het besturingssysteem

Fout nr. 2:

In het Windows-systeemlogboek worden beschadigde blok-fouten weergegeven (afbeelding 2).

SLN111146_en_US__31343098674763.2
Afbeelding 2: Fout met slechte blokkering in Windows-systeemlogboek weergegeven

Fout nr. 3:

Het RAID-controllerlogboek (TTYLOG) toont fouten zoals:

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Waarschuwing: Het controllerlogboek (TTYLOG) geeft mogelijk geen fouten weer.

Meer informatie over het ontvangen van deze specifieke logbestanden vindt u in ons artikel over het verzamelen van logbestanden.

2. Wat is de oorzaak?

RAID-arrays zijn niet immuun voor datafouten. Firmware voor RAID-controllers en harde schijven bevatten functionaliteit waarmee verschillende soorten datafouten kunnen worden gedetecteerd en gecorrigeerd voordat ze naar een array/schijf worden geschreven. Het gebruik van verouderde firmware kan ertoe leiden dat onjuiste data naar een array/schijf worden geschreven omdat de functies voor foutafhandeling/foutcorrectie die beschikbaar zijn in de nieuwste firmwareversies ontbreken.
Datafouten kunnen ook worden veroorzaakt door fysieke slechte blokken. Dit kan bijvoorbeeld gebeuren wanneer de lees-/schrijfkop het draaiplateau raakt (ook wel 'head crash' genoemd). Blokken kunnen na een tijdje verslechteren doordat het plateau op een specifieke locatie minder goed bits magnetisch kan opslaan. Slechte blokken als gevolg van een minder goed functionerend plateau kunnen vaak wel gelezen worden. Zo'n slecht blok kan alleen af en toe of via een uitgebreide diagnose op de schijven worden gedetecteerd.

Een slecht blok, ook wel een slecht logisch blokadres (LBA) genoemd, kan ook door logische datafouten worden veroorzaakt. Dit gebeurt wanneer data verkeerd naar een schijf worden geschreven terwijl dit wel als juist wordt gerapporteerd. Daarnaast kunnen goede data op een schijf per ongeluk worden gewijzigd. Een voorbeeld hiervan is 'bitmanipulatie' die kan optreden wanneer de lees-/schrijfkop overgaat of schrijft naar een nabijgelegen locatie waardoor data, bestaande uit nullen en enen, een andere waarde krijgen. Hierdoor wordt de 'consistentie' van de data beschadigd. De waarde van de data op een specifiek blok wijkt af van de oorspronkelijke data en komt niet meer overeen met de checksum van de data. De fysieke LBA is goed en kan met succes worden geschreven, maar bevat momenteel onjuiste data en kan worden geïnterpreteerd als een slecht blok.

Lees ons artikel over dubbele storingen en punctures in RAID-arraysvoor meer informatie.

3. Stappen om het probleem op te lossen:

Opmerking: Huidige data op de virtuele schijf zijn beschadigd en moeten worden verwijderd

Een gevalideerde databack-up maken op bestandsniveau
- Een back-up op basis van blokken zou het probleem verschuiven
- Een back-up op bestandsniveau geeft beschadigde bestanden aan (deze bestanden zouden niet meegenomen moeten worden in een back-up)
- Er is nooit een garantie van 100% voor het behouden van alle data, als er reeds een ‘puncture stripe’ aanwezig is
Ervoor zorgen dat alle defecte schijven met voorspellende fouten worden vervangen
De virtuele schijf verwijderen en opnieuw maken
- Met deze stap worden alle data verwijderd van de virtuele schijf
- Verwijder de array
- Stel de array desgewenst opnieuw samen
Voer een volledige initialisatie van de virtuele schijf uit
- Ervoor zorgen dat er geen snelle initialisatie wordt gekozen
- Alleen een volledige (= langzame) initialisatie lost het probleem op
Controleer de consistentie op de nieuwe gemaakte virtuele schijf
- Als consistentiecontrole geen fouten oplevert, kunt u ervan uitgaan dat de array in goede staat is en de puncture is verwijderd
Data kan nu naar de gezonde virtuele schijf hersteld worden
Aanbeveling: Upgrade alle firmware van de harde schijf naar de nieuwste versie

4. Aanvullende informatie

OMSA biedt de mogelijkheid om de waarschuwingen voor slechte blokken te wissen. Als u slechte blokken wilt wissen, wordt de volgende procedure aanbevolen:

Wanneer een back-up van de virtuele schijf wordt uitgevoerd terwijl de optie verifiëren is geselecteerd, kunnen er twee scenario's optreden:
- De back-upbewerking mislukt op een of meer bestanden. In dit geval herstelt u het bestand van een eerdere back-up. Nadat het bestand is hersteld, gaat u verder naar de volgende stap.
- De back-upbewerking wordt zonder fouten voltooid. Dit geeft aan dat er geen slechte blokken zijn op het geschreven gedeelte van uw virtuele schijf.
Opmerking: Als u nog steeds slechte blokwaarschuwingen ontvangt, bevinden de beschadigde blokken zich in een niet-datagebied.
Voer Patrol Read uit (onder Virtual Disk Tasks in OMSA) en controleer het systeemlogboek om er zeker van te zijn dat er geen nieuwe beschadigde blokken worden gevonden. Als er nog steeds slechte blokken zijn, gaat u verder naar de volgende stap. Als dit niet het geval is, wordt de voorwaarde gewist.

Opmerking: De geautomatiseerde Patrol Read moet worden gedeactiveerd voordat de optie om deze actie handmatig uit te voeren in OMSA wordt weergegeven.
Om deze slechte blokken te wissen, voert u de taak Clear Virtual Disk Bad Blocks uit. Dit kan worden gedaan in de OMSA GUI of gebruik de CLI-opdracht:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

Opmerking: Voor het verkrijgen van de waarden voor controller-ID en virtuele schijf-ID typt u omreport storage controller om de controller-ID's weer te geven en typt u vervolgens omreport storage vdisk controller=ID om de ID's voor de virtuele schijven weer te geven

Affected Products

Servers

Article Number: 000139277

Article Type: Solution

Last Modified: 01 Oct 2021

Version: 3

Check if your device is covered by Support Services.

Omgaan met Puncturing (Bad Blocks) op virtuele schijven voor PowerEdge servers

Summary: stappen voor probleemoplossing van slechte blokken (punctures) op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status. ...

Symptoms

Cause

Resolution

Inhoudsopgave:

1. Omschrijving storing

Fout nr. 1:

Fout nr. 2:

Fout nr. 3:

2. Wat is de oorzaak?

3. Stappen om het probleem op te lossen:

4. Aanvullende informatie

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

Omgaan met Puncturing (Bad Blocks) op virtuele schijven voor PowerEdge servers

Summary: stappen voor probleemoplossing van slechte blokken (punctures) op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status. ... View More View Less

Detailed Article

Symptoms

Cause

Resolution

Affected Products

Symptoms

Cause

Resolution

Inhoudsopgave:

1. Omschrijving storing

Fout nr. 1:

Fout nr. 2:

Fout nr. 3:

2. Wat is de oorzaak?

3. Stappen om het probleem op te lossen:

4. Aanvullende informatie

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Summary: stappen voor probleemoplossing van slechte blokken (punctures) op HDD's in PowerEdge servers met PERC-controllers. Vooral wanneer er geen back-up mogelijk is, kan de volgende informatie helpen een aangetaste virtuele schijf terug te brengen naar een optimale status. ...