Dell PERC 9 控制器 (H330、H730、H730P 和 H830) 推出了名為「快速重新建置」的功能,可在特定情況下加快重新建置故障磁碟的時間。此功能以 T10 重新建置協助為基礎。 Dell 判斷在特定條件下使用此功能時,可能會發生資料完整性問題。
目錄
- 功能運作方式
- 問題陳述
- 我該如何判斷是否發生這種情況
- 解決方案
功能運作方式:
任何具有「快速重新建置」功能的磁碟機都會向控制器註冊此功能。同位 RAID 虛擬磁碟支援此功能:Raid 5、RAID 6、RAID 50 和 RAID 60。此功能需要伺服器具備相容的磁碟機、同位 RAID 層級,以及經過設定的熱備援 (全域或特定 VD 專用)。VD 中每個具備此功能的磁碟機都會追蹤本身的故障區塊/磁區。處於這種故障的磁碟機仍可與 PERC 通訊,並會告知 PERC 哪些磁區仍「良好」。PERC 不會為整個磁碟執行耗時的 RAID 復原 XOR 演算法,而是將良好的磁區複製到熱備援,並僅需要還原已知的不良磁區。PERC 會將良好的磁區複製到熱備援區,且僅需重新建置已知的不良磁區。在沒有「快速重新建置」的情況下,PERC 必須重新建置所有磁區,對於大容量的磁碟機來說,這可能非常耗時。
問題陳述
當 PERC 為「不良」磁區重新建置資料時,它會錯誤地將資料從快取寫入故障的磁碟機,而不是熱備援。這會導致沒有將資料和相關的同位寫入熱備援。在寫入模式中,將會發生同位錯誤。 在回寫模式中,資料和相關同位皆會發生錯誤。
我該如何判斷是否發生這種情況
注意:文章 SLN295784 中解釋了如何擷取 PERC 控制器的記錄。
在 PERC 控制器的記錄中,如果您看到以下反白顯示的文字,即表示您已遇到此問題。
C0:EVT#395950-08/17/16 13:54:59: 114=State change on PD 0b(e0x20/s11) from OFFLINE(XX) to REBUILDASSIST(12)
解決方案
如果您未遇到此問題,請將 PERC H730、H730p、H830 控制器的韌體更新至 25.5.0.0018,並將 PERC H330 控制器的韌體更新為 25.5.0.0019 或更新版本,以停用「快速重新建置」功能,避免發生此狀況。
若要下載最新的韌體版本,請瀏覽至 13G 伺服器的「驅動程式與下載」區段,並展開「SAS Raid」功能表檔案。
目前的韌體已在原廠導入,且新伺服器不會遭遇此問題。
Dell 備註:作為對所有重要功能持續進行業務流程改進的一部分,Dell 會持續檢閱關鍵程序並導入改進。Dell 極為重視伺服器和儲存系統的開發、測試和製造流程。改善這些程序有助於避免未來發生問題,並讓 Dell 能更快速積極地應對現場的潛在問題。