Dell PERC 9控制器(H330、H730、H730P和H830)引入了一项叫做“快速重建”的功能,可在一定条件下加快重建故障驱动器的速度。此功能基于T10重建助手。 戴尔已经确认,在某些情况下使用此功能时有可能发生数据完整性问题。
目录
- 功能运行方式
- 问题陈述
- 如何判断是否已发生错误
- 解决方案
功能运行方式:
任何有能力快速重建的驱动器都会赋予控制器这项功能。奇偶校验 RAID 虚拟磁盘支持此功能:Raid 5、RAID 6、RAID 50 和 RAID 60。该功能需要服务器具有能支持的驱动器、基于奇偶校验的RAID级别和已配置热备件(全局或完全专用的虚拟磁盘)。虚拟磁盘中每个能支持的驱动器都会跟踪它自己的故障块/扇区。某个驱动器可能发生故障,但它仍可以与 PERC 通信,并告诉 PERC 哪些扇区仍然“良好”。PERC会将好扇区复制到热备件,并且只须恢复已知坏扇区,而不是为整个磁盘执行耗时的RAID恢复XOR算法。PERC会将好扇区复制到热备件,并且只须重建那些已知坏扇区。如果没有快速重建,PERC必须重建所有扇区,对于大容量驱动器可能耗费大量时间。
问题陈述
当 PERC 正在重建“坏”扇区的数据时,错误地将缓存中的数据写入故障驱动器而不是热备件。这会导致数据和相关的奇偶校验没有写入热备件。在直写模式下,将会发生奇偶校验错误。 在回写模式下,数据和相关的奇偶校验都会发生错误。
如何判断是否已发生错误
提醒:SLN295784 一文介绍了如何提取 PERC 控制器日志。
在PERC控制器日志中,如果您看到以下突出显示的文本,说明您遇到了问题。
C0:EVT#395950-08/17/16 13:54:59: 114=State change on PD 0b(e0x20/s11) from OFFLINE(XX) to REBUILDASSIST(12)
解决方案
如果您没遇到过这个问题,为防止这种情况的出现,请将您的 PERC H730、H730p、H830 控制器固件更新到 25.5.0.0018,将 PERC H330 控制器固件更新到 25.5.0.0019 或更高版本固件,从而禁用快速重建功能。
要下载最新固件版本,请导航到第13代服务器的“驱动程序和下载”部分,然后展开“SAS Raid”菜单文件。
在工厂中已实现正确的固件,新服务器不会出现此问题。
戴尔提醒:作为跨所有关键功能的持续业务流程改进的一部分,戴尔不断审查关键流程并实施改进。戴尔高度专注于服务器和存储系统的开发、测试和生产流程。这些流程的改进将有助于防止将来出现问题,并使戴尔能对现场潜在的问题作出更快速、更主动的响应。