Řadiče Dell PERC 9 (H330, H730, H730P a H830) využívají funkci Rapid Rebuild, která zrychluje opětovné vytvoření chybových disků za určitých podmínek. Tato funkce je založená na službě T10 Rebuild Assist. Společnost Dell zjistila, že existuje možnost problémů s integritou dat, když je tato funkce používána za určitých podmínek.
Obsah
- Provoz funkce
- Popis problému
- Jak zjistím, pokud k tomu došlo
- Řešení
Provoz funkce:
Každý disk s funkcí Rapid Rebuild zaregistruje tuto možnost u řadiče. Tato funkce je podporována paritními virtuálními disky RAID: Raid 5, RAID 6, RAID 50 a RAID 60. Funkce vyžaduje, aby měl server vhodné disky, úrovně RAID na bázi parity a konfigurované jednotky hot spare (globální nebo vyhrazené pro konkrétní virtuální disk). Každá vhodná jednotka virtuálního disku sleduje vlastní bloky/sektory, u nichž došlo k selhání. Při selhání disku pak může být nadále možná komunikace s řadičem PERC a informování řadiče PERC o tom, které sektory jsou stále v pořádku. Namísto provádění časově náročných algoritmů XOR obnovy pole RAID pro celý disk zkopíruje řadič PERC funkční sektory na jednotku hot spare a bude muset opětovně vytvořit pouze známé vadné sektory. Řadič PERC zkopíruje funkční sektory na jednotku hot spare a bude muset opětovně vytvořit pouze tyto známé vadné sektory. Bez funkce Rapid Rebuild musí řadič PERC opětovně vytvořit všechny sektory, což může být u disků s velkou kapacitou velice časově náročné.
Popis problému
Když řadič PERC opětovně vytváří data z chybových sektorů, zapisuje data z cache na chybový disk namísto na jednotku hot spare. V důsledku toho nejsou data a související parita zapsána na jednotku hot spare. V režimu Write Through dojde k chybám parity. V režimu Write Back dojde k chybám dat i související parity.
Jak zjistím, pokud k tomu došlo
Poznámka: Popis extrahování protokolu řadiče PERC je vysvětlen
v článku SLN295784.
V protokolu řadiče PERC označuje problém níže zvýrazněný text.
C0:EVT#395950-08/17/16 13:54:59: 114=State change on PD 0b(e0x20/s11) from OFFLINE(XX) to REBUILDASSIST(12)
Řešení
-
Pokud byl virtuální disk v režimu Write Through, jsou ohrožena jen paritní data a paritu obnoví kontrola konzistence (CC). Toto bude fungovat, pouze pokud jde o jediný výskyt služby Rebuild Assist. Pokud se na jednom virtuální disku vyskytne více než jeden případ služby Rebuild Assist, měli byste obnovit data ze starší zálohy.
-
Pokud byl virtuální disk v režimu Write Back a došlo k problému, měli byste obnovit data ze zálohy. Ztracená data bohužel není možné nijak obnovit. Proveďte obnovení z předchozí zálohy.
Pokud jste se s touto chybou nesetkali, v rámci prevence tohoto scénáře aktualizujte firmware řadiče PERC H730, H730p, H830 na verzi 25.5.0.0018 a firmware řadiče PERC H330 na verzi 25.5.0.0019 nebo novější. To deaktivuje funkci Rapid Rebuild.
Nejnovější verzi firmwaru si můžete stáhnout z části Ovladače a soubory ke stažení serveru 13. generace, kde je nutné rozbalit soubor nabídky Pole RAID SAS.
Nových serverů se tento problém netýká, protože u nich byl v továrně implementován správný firmware.
Poznámka společnosti Dell: V rámci průběžného zefektivnění podnikových procesů ve všech hlavních oblastech společnost Dell neustále kontroluje klíčové procesy a zavádí zlepšení. Společnost Dell klade velký důraz na vývoj, testování a tvorbu procesů pro své servery a úložné systémy. Tato zlepšení procesů do budoucna zabrání problémům a umožňují společnosti Dell reagovat rychleji a efektivněji na možné potíže v oblasti.