PowerEdge: Hur åtgärdar man dubbelfel och punkteringar på RAID-matriser
Summary:Den här artikeln innehåller information om dubbelfel och punkteringar i en RAID-modul och den ger även råd om hur du åtgärdar problemet.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Varning! Om du följer de här stegen förlorar du alla data i disksystemet. Innan du utför stegen bör du se till att alla data i disksystemet är säkerhetskopierade och att inga andra disksystem påverkas om du följer dessa steg.
RAID-disksystem är inte immuna mot datafel. RAID-styrenheten och den inbyggda programvaran på hårddisken innehåller funktioner för att upptäcka och korrigera många typer av datafel innan de skrivs till ett disksystem/en disk.
Datafel kan orsakas av fysiska dåliga block, till exempel en "Head Crash" eller försämring av skivans förmåga att magnetiskt lagra bitar på en viss plats.
Ett felaktigt block, även kallat en dålig logisk blockadress (LBA), kan också orsakas av logiska datafel, t.ex. en "bitvändning" eller felaktiga data som skrivs till en enhet.
Felaktiga LBA-adresser rapporteras vanligtvis som Sense Code 3/11/0.
Dells maskinvarubaserade RAID-styrenheter erbjuder funktioner som Patrol Read och Check Consistency som korrigerar många datafelssituationer.
Om du utför regelbundna konsekvenskontroller korrigeras enskilda fel, oavsett om det är ett fysiskt felaktigt block eller ett logiskt fel i data.
Enhetlighetskontrollen minskar dessutom risken för ett dubbelfel i händelse av ytterligare fel.
Figur 1 Flera enskilda fel i ett RAID 5-disksystem – optimalt disksystem
Figur 2 Dubbelfel på en drivenhet som inte fungerar (data i stripes 1 och 2 har gått förlorade) – degraderat disksystem.
Figur 3 Punkterade ränder (data i stripe 1 och 2 går förlorade på grund av dubbelfel) – optimalt disksystem.
En punktering är en funktion som ingår i Dells PERC-styrenheter. Den har utformats för att styrenheten ska återställa disksystemets redundans trots förlust av data som orsakas av dubbelfel.
En punktering är också känd som "återuppbygga med fel".
En punktering kan uppstå i en av två situationer: ett dubbelfel finns redan, eller så finns det inget dubbelfel.
En punktering kan inträffa på tre platser: ett tomt utrymme, ett icke-kritiskt datautrymme eller ett datautrymme som används.
Alla tillstånd som leder till att data är otillgängliga i samma strimla på mer än en disk är dubbelfel.
Dubbelfel leder till förlust av alla data inom den berörda strimlan.
Alla punkteringar är dubbelfel men alla dubbelfel är INTE punkteringar.
Proaktivt underhåll kan korrigera befintliga fel och förhindra att vissa fel uppstår.
Uppdatera drivrutiner och fast programvara på styrenheter, hårddiskar, bakplan och andra enheter.
Utför rutinmässiga åtgärder för konsekvenskontroll.
Granska loggarna för indikationer på problem.
Obs! Om enhetlighetskontrollen slutförs utan fel kan du förutsätta att disksystemet fungerar som det ska och att punkteringen har eliminerats. Data kan nu återställas till det fungerande disksystemet.
Viktigt! Om det finns ett känt eller misstänkt dubbelfel eller punktering, följ dessa steg för att minimera risken för allvarligare problem:
Utför en rutinmässig konsekvenskontroll (disksystemet måste vara optimalt)
Kontrollera eventuella maskinvaruproblem
Kontrollera styrenhetsloggen
Kör maskinvarudiagnostik
Kontakta Dells tekniska support vid behov
Obs! Om dessa steg har utförts, så finns det ytterligare problem. Punkteringar kan ge statusen ”förutsägbart fel” i hårddiskar över tid. Datafel som sprids till en enhet rapporteras som mediefel på enheten, även om det inte finns några maskinvaruproblem.
Obs! Genom att övervaka systemet kan problem upptäckas och åtgärdas i tid, vilket också minskar risken för allvarligare problem.