Med Dell PERC 9-styrenheterna (H330, H730, H730P och H830) infördes funktionen Rapid Rebuild som under vissa omständigheter snabbar upp återskapandet av hårddiskar med fel. Den här funktionen baseras på T10 Rebuild Assist. Dell har fastställt att det under vissa förutsättningar finns en viss risk för dataintegritetsproblem när funktionen används.
Innehållsförteckning
- Så här fungerar funktionen
- Beskrivning av problemet
- Hur tar jag reda på om det har hänt
- Lösning
Så här fungerar funktionen:
För alla enheter som är kompatibla med Rapid Rebuild är funktionen registrerad med styrenheten. Den här funktionen stöds med virtuella paritets-RAID-diskar: RAID 5, RAID 6, RAID 50 och RAID 60. För funktionen krävs att en server har kompatibla enheter, paritetsbaserade RAID-nivåer och en konfigurerad reservenhet (global eller avsedd för den virtuella disken i fråga). Alla kompatibla enheter i den virtuella disken håller reda på sina egna felaktiga block/sektorer. En enhet kan sedan misslyckas på ett sådant sätt att den fortfarande kan kommunicera med PERC och ange för PERC vilka sektorer som fortfarande är "bra". I stället för att utföra tidskrävande XOR-algoritmer för RAID-återställning för hela disken kopierar PERC-styrenheten de fungerande sektorerna till reservenheten och behöver bara återställa de skadade sektorerna. PERC-styrenheten kopierar de fungerande sektorerna till reservenheten och behöver bara återskapa de skadade sektorerna. Utan Rapid Rebuild måste PERC återskapa alla sektorer, vilket kan vara mycket tidskrävande när det gäller enheter med stor kapacitet.
Beskrivning av problemet
När PERC återskapar data för de "felaktiga" sektorerna skriver den felaktigt data från cacheminnet till den felaktiga enheten i stället för reservenheten. Det leder till att data och tillhörande paritet inte skrivs till reservenheten. I Write through-läge uppstår paritetsfel. I Write back-läge inträffar fel i både data och tillhörande paritet.
Hur tar jag reda på om det har hänt
Obs! Hur du extraherar PERC-styrenhetsloggen förklaras
i artikeln SLN295784.
Om den markerade texten nedan finns i PERC-styrenhetsloggen har du stött på problemet.
C0:EVT#395950-08/17/16 13:54:59: 114=Tillståndsändring på PD 0b (e0x20/s11) från OFFLINE (XX) till REBUILDASSIST(12)
Lösning
-
Om den virtuella disken var i läget Write Through har endast paritetsdata utsatts för risk, och om du kör en konsekvenskontroll återställs pariteten. Det här fungerar bara om det är en enskild förekomst av Rebuild Assist. Om det finns mer än en förekomst av Rebuild Assist för samma virtuella disk bör du återställa dina data från en tidigare säkerhetskopia.
-
Om den virtuella disken var i läget Write Back och du har stött på problemet bör du återställa dina data från säkerhetskopian. Det finns tyvärr inget sätt att återställa dessa förlorade data. Återställ från en tidigare säkerhetskopia.
Om du inte har stött på det här problemet ska du uppdatera den fasta programvaran för PERC H730-, H730p-, H830-styrenheten till version 25.5.0.0018 och den fasta programvaran för PERC H330-styrenheten till version 25.5.0.0019 eller senare av den fasta programvaran som inaktiverar funktionen för snabb ombyggnad.
Du hämtar den senaste versionen av den fasta programvaran genom att gå till avsnittet "Drivrutiner och hämtningsbara filer för en 13G-server och expandera menyfilen SAS Raid.
Rätt fast programvara har installerats på fabriken och nya servrar utsätts inte för problemet.
Obs! Som en del av den löpande processförbättringen för alla huvudfunktioner granskar Dell kontinuerligt viktiga processer och implementerar förbättringar. Dell lägger stor vikt vid arbetet med utveckling, test och tillverkningsprocesser för våra servrar och lagringssystem. Dessa processförbättringar hjälper till att förhindra framtida problem och gör att Dell kan reagera snabbare och effektivare på potentiella problem inom området.