Sommaire
1. Introduction
2. Description
3. Solution
4. Autres informations
S.M.A.R.T. SMART (Technologie d’auto-surveillance, d’analyse et de reporting) est un système de surveillance de l’intégrité des disques durs et des disques SSD qui a été normalisé au niveau international.
La fonction principale de SMART est de détecter et de signaler divers indicateurs de fiabilité des disques, dans le but d’anticiper les pannes matérielles imminentes, ce qui permet de remplacer le matériel avant la panne et de maintenir l’intégrité des données.
Dell EMC a collaboré avec nos fournisseurs de disques durs pour interpréter ces valeurs.
Il a été constaté, en examinant le statut SMART de certains disques durs d’entreprise, que des taux élevés de lecture et de vérification ECC (code de correction d’erreur) peuvent être observés sur certains modèles. Lorsque ces valeurs sont comparées à celles d’autres disques durs, il semble que certains modèles de disques durs présentent un taux d’erreur beaucoup plus élevé que d’autres, et des corrections zéro ECC peuvent être signalées. Dans certains cas, ce taux d’erreur s’affiche sous forme de centaines de millions de corrections ECC et peut s’incrémenter rapidement à mesure que des transactions d’E/S se produisent.
Un exemple de cette situation est fourni ci-dessous. Cet exemple est basé sur l’exécution de la commande « smartctl -a /dev/sdX » sous Linux.
Figure 1 : Journal du compteur d’erreurs
Remarque : l’application Smartctl est un composant de smartmontools, un ensemble d’outils open source pour l’interrogation de l’état des disques physiques.
Remarque : il arrive que les journaux SMART présentés par les disques durs d’entreprise et interprétés par des utilitaires tiers, tels que smartmontools, ne présentent pas le nombre réel d’erreurs ECC des appareils.
La spécification SMART permet aux fournisseurs de fournir des compteurs tels que ceux indiqués dans l’exemple ci-dessus, à des fins d’information. Les compteurs ne comptent pas nécessairement les défaillances logicielles et matérielles dans la logique ECC. Ils offrent une certaine flexibilité à chaque fournisseur de disques concernant les informations qui s’affichent dans les champs SMART disponibles. Chez certains fournisseurs, aucune donnée d’erreur n’est présentée dans les catégories de lecture ou de vérification ECC. Dans l’exemple ci-dessus, le fournisseur a choisi d’utiliser les compteurs pour surveiller la fonctionnalité ECC. Les valeurs présentées ne représentent pas un taux d’erreur. De la même façon, un taux plus élevé d’événements sur certains disques par rapport à d’autres n’indique pas qu’il existe un problème de performances.
Remarque : les paramètres SMART ne doivent pas être comparés à une base d’installation mixte de fournisseurs ou de modèles. Seuls les modèles et firmwares similaires sont comparables.
Si vous avez une requête spécifique concernant les compteurs d’intégrité sur un certain modèle de disque dur d’entreprise, veuillez contacter les techniciens du support qui collaborent avec les équipes d’ingénierie Dell EMC pour vous apporter des réponses.
- Pour plus d’informations sur la normalisation internationale des valeurs SMART et sur les autres interfaces de stockage SCSI, veuillez consulter la page d’accueil du comité technique T10 ici.
- Smartmontools est un ensemble de programmes utilitaires permettant de contrôler et de surveiller les systèmes de stockage informatique à l’aide du système SMART (Self-Monitoring, Analysis and Reporting Technology) intégré à la plupart des disques durs ATA, Serial ATA, SCSI/SAS et NVMe modernes. Il ne s’agit pas d’un outil Dell EMC. Vous trouverez de plus amples informations sur Smartmontools ici.