Las controladoras Dell PERC 9 (H330, H730, H730P y H830) incorporaron una función llamada Recompilación rápida, la cual acelera el tiempo de recompilación de unidades con fallas en ciertas condiciones. Esta función se basa en T10 Rebuild Assist. Dell determinó que existe la posibilidad de que ocurran problemas de integridad de datos cuando se usa esta función en ciertas condiciones.
Tabla de contenido
- Operación de la función
- Declaración del problema
- Cómo determinar si esto sucedió
- Solución
Operación de la función:
Cualquier unidad capaz de realizar una Recompilación rápida registrará esta funcionalidad con la controladora. Esta función soporta discos virtuales raid de paridad: Raid 5, RAID 6, RAID 50 y RAID 60. La función requiere un servidor que cuente con unidades compatibles, niveles de RAID basados en paridad y un repuesto activo configurado (global o dedicado para el DV exacto). Cada unidad compatible con el DV realiza un seguimiento de sus propios bloques/sectores defectuosos. Luego, es posible que una unidad falle de tal forma que aún puede comunicarse con la PERC e informarle qué sectores aún están "en buen estado". En lugar de realizar algoritmos XOR de recuperación de RAID en todo el disco que demoran mucho tiempo, la PERC copiará los sectores en buen estado al repuesto activo y solo tendrá que recompilar los sectores defectuosos conocidos. La PERC copiará los sectores en buen estado al repuesto activo y solo tendrá que recompilar los sectores defectuosos conocidos. Sin una Recompilación rápida, la PERC debe recompilar todos los sectores, lo cual puede tardar mucho tiempo en unidades de gran capacidad.
Declaración del problema
Cuando la PERC está recompilando los datos para los sectores "defectuosos", escribe incorrectamente los datos de la caché en el disco defectuoso en lugar de hacerlo en el repuesto activo. Esto provoca que los datos y la paridad asociada no se escriban en el repuesto activo. En el modo de escritura simultánea, se producirán errores de paridad. En el modo de escritura no simultánea, se producirán errores en los datos y la paridad asociada.
Cómo determinar si esto sucedió
Nota: En el artículo SLN295784, se explica cómo extraer el registro de la controladora PERC.
Desde el registro de la controladora PERC, si observa el siguiente texto resaltado, habrá encontrado el problema.
C0:EVT#395950-08/17/16 13:54:59: 114=State change on PD 0b(e0x20/s11) from OFFLINE(XX) to REBUILDASSIST(12)
Solución
-
Si su DV estaba en el modo de escritura simultánea, solo los datos de paridad están en riesgo y ejecutar una CC (comprobación de consistencia) restaurará la paridad. Esto solo funcionará si se trata de un único caso de asistencia de recompilación. Si hay más de un caso de asistencia de recompilación para el mismo DV, debe restaurar sus datos desde un respaldo anterior.
-
Si su DV estaba en el modo de escritura no simultánea y detectó este problema, entonces debe restaurar sus datos desde un respaldo. Lamentablemente, no hay forma de recuperar los datos perdidos. Restaure desde un respaldo anterior.
Si no encuentra este problema, entonces para evitar esta situación, actualice el firmware de la controladora PERC H730, H730p, H830 a 25.5.0.0018 y el firmware de la controladora PERC H330 a 25.5.0.0019 o posterior, lo cual deshabilita la función Recompilación rápida.
Para descargar la versión de firmware más reciente, vaya a la sección "Drivers and Downloads" (Controladores y descargas) de un servidor 13G y amplíe el archivo de menú "SAS Raid" (Raid de SAS).
Se implementó el firmware correcto a nivel de fábrica y los nuevos servidores no están expuestos a este problema.
Nota de Dell: Como parte de la mejora continua de los procesos de negocio en todas las funciones clave, Dell revisa constantemente los procesos clave e implementa mejoras. Dell se enfoca mucho en los procesos de desarrollo, prueba y fabricación para nuestros sistemas de servidores y almacenamiento. Estas mejoras de proceso ayudarán a evitar problemas en el futuro y permiten que Dell reaccione de forma más rápida y agresiva a posibles problemas en terreno.