Tabla de contenido
1. Introducción
2. Descripción
3. Solución
4. Más información
Falla S.M.A.R.T. La tecnología de monitoreo automático, análisis y generación de informes (a menudo escrita como SMART) es un sistema de monitoreo de estado para discos duros y unidades de estado sólido que se ha estandarizado internacionalmente.
La función principal de SMART es detectar e informar sobre diversos indicadores de confiabilidad de la unidad, con la intención de anticipar fallas inminentes de hardware, lo cual permite reemplazar el hardware antes de la falla y mantener la integridad de los datos.
Dell EMC ha colaborado con nuestros proveedores de discos duros en la interpretación de estos valores.
Se descubrió, mientras se revisaba el estado SMART de algunos discos duros empresariales, que en algunos modelos se pueden observar altas tasas de corrección de lectura y verificación de ECC (código de corrección de errores). Si estos valores se comparan con otros discos duros, es posible que parezcan indicar que algunos modelos de discos duros específicos tienen una tasa de errores mucho mayor que otras que pueden informar cero correcciones de ECC. En algunos casos, esta tasa de errores aparecerá como cientos de millones de correcciones de ECC y puede aumentar rápidamente mientras se producen más transacciones de E/S.
A continuación, se proporciona un ejemplo de esta situación. Este ejemplo se recopiló ejecutando el comando “smartctl -a /dev/sdX” en el sistema operativo Linux.
Figura 1: Registro del contador de errores
Nota: La aplicación Smartctl es un componente de Smartmontools, un conjunto de herramientas de código abierto para consultar el estado de los discos físicos.
Nota: Los registros de SMART que se presentan en las unidades de disco duro empresariales y son interpretados por utilidades de otros fabricantes, como Smartmontools, podrían no representar el recuento real de errores de ECC para los dispositivos.
La especificación SMART permite a los proveedores proporcionar estos contadores, como los que se muestran en el ejemplo anterior, con fines informativos. Los contadores no son necesariamente un recuento de errores graves o leves dentro de la lógica de ECC. Esto permite flexibilidad para lo que cada proveedor de la unidad muestra en los campos SMART disponibles. Para algunos proveedores, no se presenta ningún dato de error en las categorías de lectura o verificación de ECC. En el ejemplo anterior, el proveedor optó por utilizar los contadores para monitorear la funcionalidad de ECC. Los valores que se presentan no representan una tasa de error. De manera similar, una mayor tasa de eventos en algunos discos en comparación con otros no indica que hay un problema de rendimiento.
Nota: Los parámetros de SMART no se deben comparar en una base de instalación mixta de proveedores o modelos; solo se deben comparar modelos y firmware similares.
Si tiene una consulta específica relacionada con los contadores de estado de un determinado modelo de disco duro empresarial, comuníquese con nuestros técnicos de soporte que pueden trabajar para obtener una respuesta de los equipos de ingenieros de Dell EMC.
- Para obtener más información sobre la estandarización internacional de los valores de SMART y otras interfaces de almacenamiento SCSI, consulte la página de inicio del Comité técnico T10 que se encuentra aquí.
- Smartmontools es un conjunto de programas de utilidades para controlar y monitorear los sistemas de almacenamiento de computadoras mediante el sistema de tecnología de monitoreo automático, análisis y generación de informes incorporado en la mayoría de los discos duros ATA, serial ATA, SCSI/SAS y NVMe modernos. No es una herramienta de Dell EMC. Puede encontrar más información sobre Smartmontools aquí.