PowerEdge: Cómo solucionar fallas dobles y perforaciones en arreglos RAID
Summary:En este artículo, se proporciona información sobre fallas dobles y perforaciones en un arreglo RAID y se aconseja cómo solucionar el problema.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Advertencia: Seguir estos pasos da como resultado la pérdida de todos los datos en el arreglo. Antes de realizar los pasos, asegúrese de que todos los datos en el arreglo estén respaldados y de que seguir estos pasos no afecte a ningún otro arreglo.
Los arreglos RAID no son inmunes a los errores de datos. La controladora RAID y el firmware del disco duro contienen funciones para detectar y corregir diversos tipos de errores de datos antes de que se escriban en un arreglo o una unidad.
Los errores de datos pueden ser causados por bloques defectuosos físicos, como un "Head Crash" o la degradación de la capacidad del disco para almacenar bits de forma magnética en una ubicación específica.
Un bloque defectuoso, también conocido como una dirección de bloque lógico (LBA) incorrecta, también puede deberse a errores de datos lógicos, como un "cambio de bits" o la escritura de datos incorrectos en una unidad.
Los LBA defectuosos se informan comúnmente como el código de detección 3/11/0.
Las controladoras RAID basadas en hardware de Dell ofrecen funciones como la lectura de patrullaje y la verificación de congruencia para corregir muchas situaciones de error de datos.
Realizar operaciones regulares de comprobación de coherencia corregirá las fallas únicas, ya sea un bloque físico defectuoso o un error lógico de los datos.
La verificación de consistencia también mitigará el riesgo de una condición de falla doble en caso de que se produzcan errores adicionales.
Figura 1 Múltiples fallas únicas en un arreglo RAID 5: arreglo óptimo
Figura 2 Falla doble con una unidad fallida (pérdida de datos en las fracciones 1 y 2): arreglo degradado.
Figura 3 Fracciones perforadas (los datos en las fracciones 1 y 2 se pierden debido a una condición de falla doble): arreglo óptimo.
Una perforación es una característica de las controladoras PERC de Dell, diseñada para permitir que la controladora restaure la redundancia del arreglo, a pesar de la pérdida de datos producida por una condición de falla doble.
Una perforación también se conoce como "reconstrucción con errores".
Un pinchazo puede ocurrir en una de dos situaciones: una doble falla ya existe o una doble falla no existe.
Se puede producir una perforación en tres ubicaciones: un espacio en blanco, un espacio de datos no críticos o un espacio de datos al que se accede.
Cualquier condición que impida el acceso a los datos en la misma banda en más de una unidad es una falla doble
Las fallas dobles causan la pérdida de todos los datos dentro de la banda afectada
Todas las perforaciones son fallas dobles, pero NO todas las fallas dobles son perforaciones
El mantenimiento proactivo puede corregir los errores existentes y evitar que se produzcan algunos de ellos.
Actualizar controladores y firmware en controladoras, discos duros, backplanes y otros dispositivos.
Realizar operaciones rutinarias de verificación de coherencia.
Revise los registros para ver si hay indicios de problemas.
Nota: Si la verificación de consistencia se completa sin errores, puede suponer con seguridad que el arreglo se encuentra en buenas condiciones y que la perforación se ha eliminado. Los datos ahora se pueden restaurar al arreglo en buen estado.
Advertencia: Si existe una condición conocida o sospechada de doble falla o perforación, siga estos pasos para minimizar el riesgo de problemas más graves:
Realice una rutina de verificación de congruencia (el arreglo debe ser óptimo)
Determine si existen problemas de hardware
Compruebe el registro de la controladora
Realice diagnóstico de hardware
Comuníquese con el soporte técnico de Dell si fuese necesario
Nota: Si estos pasos se realizaron, existen problemas adicionales que considerar. Con el paso del tiempo, las perforaciones pueden hacer que los discos duros entren en un estado de falla predictiva. Los errores de datos que se propagan a una unidad se informarán como errores de medios en la unidad, aunque no existan problemas de hardware.
Nota: El monitoreo del sistema permite detectar y corregir problemas de manera oportuna, lo que también reduce el riesgo de problemas más graves.
Duración: 00:01:53
Cuando esté disponible, se puede elegir la configuración de idioma de los subtítulos cerrados (subtítulos) mediante el ícono CC en este reproductor de video.
Cómo importar la configuración externa para Dell PERC
Duración: 00:02:07
Cuando esté disponible, se puede elegir la configuración de idioma de los subtítulos cerrados (subtítulos) mediante el ícono CC en este reproductor de video.
Cómo borrar la configuración externa de Dell PERC
Duración: 00:02:02
Cuando esté disponible, se puede elegir la configuración de idioma de los subtítulos cerrados (subtítulos) mediante el ícono CC en este reproductor de video.