Denne artikkelen inneholder feilsøkingstrinn for (punktering av) ugyldige blokker på harddisker i PowerEdge-servere med PERC-kontrollere. Spesielt når sikkerhetskopiering ikke er mulig, kan følgende informasjon bidra til å få en påvirket virtuell stasjon tilbake til en optimal tilstand.
OpenManage Server administrator (OMSA) viser et rødt kryss foran en virtuell disk (figur 1).
Figur 1: Virtuell disk med rødt kryss i status (for eksempel H800)
Systemloggen i Windows viser feil med ugyldig blokk (figur 2).
Figur 2: Feil blokkeringsfeil i Windows-systemloggen vises
RAID-kontrollerlogg (TTYLOG) viser feil som:
02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f
Du finner mer informasjon om hvordan du mottar disse spesifikke loggene i vår artikkel om å samle inn logger.
RAID-matriser er ikke immune mot datafeil. RAID-kontrolleren og fastvare for harddisker inneholder funksjoner som sporer og korrigerer mange typer datafeil før de skrives til en matrise/stasjon. Hvis du bruker utdatert fastvare, kan det føre til at feil data skrives til en matrise/stasjon fordi den mangler funksjonene for feilhåndtering/feilkorrigering som er tilgjengelige i de nyeste fastvareversjonene.
Datafeil kan også skyldes fysiske ugyldige blokker. Dette kan for eksempel oppstå når skrive-/lesehodet påvirker den roterende platen (kalt et «hodekrasj»). Blokker kan også bli ugyldige over tid fordi platens evne til å lagre biter magnetisk på en bestemt plassering blir svekket. Ugyldige blokker som skyldes svekkelse i platen, kan ofte leses. En slik ugyldig blokk kan bare spores uregelmessig eller med utvidet diagnostikk på stasjonene.
En ugyldig blokk, også kalt en ugyldig logisk blokkadressering (LBA), kan også skyldes feil i logiske data. Dette skjer når data skrives feil til en stasjon, selv om skrivingen rapporteres som vellykket. I tillegg kan gyldige data som er lagret på en disk, bli endret utilsiktet. Det kan for eksempel forekomme en «bitvending» når lese/-skrivehodet videresender eller skriver til en plassering i nærheten og fører til at data i form av nuller og ettall endres til en annen verdi. Et slikt forhold fører til at datakonsekvensen blir skadet. Verdien av dataene på en bestemt blokk er forskjellig fra de opprinnelige dataene, og det er ikke sikkert at den samsvarer med kontrollsummen for dataene. Den fysiske LBA-en fungerer og kan skrives til uten problemer, men den inneholder for øyeblikket feil data og kan tolkes som en ugyldig blokk.
Hvis du vil ha mer informasjon, kan du lese artikkelen om doble feil og punkteringer i RAID-matriser.
Opprett en validert sikkerhetskopi av dataene på filnivå
Kontroller at alle defekte stasjoner som viser prediktive feil, erstattes
Slett og opprett den virtuelle disken på nytt
Utfør en fullstendig initialisering av VD-en
Utfør en konsekvenskontroll på den nyopprettede VD-en
Data kan nå gjenopprettes til den friske VD-en
Anbefaling: Oppgrader all harddiskfastvaren til nyeste versjon
OMSA gir deg muligheten til å fjerne advarslene om ugyldige blokker. Følgende fremgangsmåte anbefales for å fjerne ugyldige blokker:
Når du utfører en sikkerhetskopi av den virtuelle disken med alternativet Verify (Bekreft) valgt, kan det oppstå to scenarioer:
Kjør Patrol Read (under oppgaver for virtuell disk i OMSA), og kontroller systemhendelsesloggen for å sikre at det ikke blir funnet noen nye ugyldige blokker. Hvis det fremdeles finnes ugyldige blokker, går du videre til neste trinn. Hvis ikke er tilstanden fjernet.
Hvis du vil fjerne disse ugyldige blokkene, kan du utføre oppgaven Clear Virtual Disk Bad Blocks. Dette kan gjøres i OMSA GUI eller ved hjelp av cli-kommandoen:
omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id
omreport storage controller
for å vise kontroller-ID-ene, og skriver deretter inn omreport storage vdisk controller=ID
for å vise ID-ene for de virtuelle diskene