Inhaltsverzeichnis
1. Einführung
2. Beschreibung
3. Lösung
4. Weitere Informationen
S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology; oft auch als SMART bezeichnet) ist ein System zur Überwachung des Zustands von Festplatten und Laufwerken, das international standardisiert wurde.
Die Hauptfunktion von SMART besteht darin, verschiedene Indikatoren für die Zuverlässigkeit des Laufwerks zu erkennen und darüber zu berichten, um drohende Hardwareausfälle vorauszusehen, so dass die Hardware vor dem Ausfall ausgetauscht werden kann und die Integrität der Daten erhalten bleibt.
Dell EMC hat bei der Interpretation dieser Werte mit unseren Festplattenanbietern zusammengearbeitet.
Bei einigen Festplattenmodellen der Enterprise-Klasse wurden bei der Überprüfung des SMART-Status beim Lesen und Überprüfen von ECC-Fehlern (Error Correction Code) hohe SMART-Fehlerraten festgestellt. Wenn diese Werte mit anderen Festplatten verglichen werden, weist dies möglicherweise darauf hin, dass einige bestimmte Festplattenmodelle eine wesentlich höhere Fehlerrate aufweisen als andere, die null ECC-Korrekturen melden können. In einigen Fällen wird diese Fehlerrate als Hunderte von Millionen von ECC-Korrekturen angezeigt und kann sich bei weiteren Transaktionen schnell erhöhen.
Nachstehend finden Sie ein Beispiel für diese Situation. Dieses Beispiel wurde durch Ausführen des Befehls „smartctl -a /dev/sdX“ unter dem Betriebssystem Linux erfasst.
Abbildung 1: Fehlerzählerprotokoll
Hinweis: Die Smartctl-Anwendung ist eine Komponente von smartmontools, einem Open-Source-Tool, mit dem der Zustand physischer Festplatten abgefragt werden kann.
Hinweis: SMART-Logs, die von Enterprise-Festplatten angezeigt werden und von Drittanbieter-Dienstprogrammen wie smartmontools interpretiert werden, stellen möglicherweise nicht die tatsächliche Anzahl der ECC-Fehler für die Geräte dar.
Die SMART-Spezifikation ermöglicht es Anbietern, diese Zähler, wie z. B. die im obigen Beispiel dargestellten, zu Informationszwecken bereitzustellen. Die Zähler stellen nicht unbedingt eine Anzahl von Hard- oder Soft-Fehlern innerhalb der ECC-Logik dar. Dadurch können die einzelnen Laufwerkanbieter flexibel festlegen, was in den verfügbaren SMART-Feldern angezeigt wird. Bei einigen Anbietern werden keine Fehlerdaten in den ECC-Kategorien Lesen oder Überprüfen angezeigt. Im obigen Beispiel hat der Anbieter die Zähler für die Überwachung der ECC-Funktionen verwendet. Die dargestellten Werte stellen keine Fehlerrate dar. In ähnlicher Weise weist eine höhere Rate von Ereignissen auf einigen Datenträgern im Vergleich zu anderen nicht darauf hin, dass ein Leistungsproblem vorliegt.
Hinweis: SMART-Parameter sollten nicht über eine gemischte Installationsbasis von mehreren Anbietern oder aus mehreren Modellen hinweg verglichen werden. Es sollten nur ähnliche Modelle und Firmware verglichen werden.
Wenn Sie eine bestimmte Frage in Bezug auf die Zustandszähler auf einem bestimmten Modell von Enterprise-Festplattenlaufwerken haben, wenden Sie sich bitte an unsere Support-Techniker, die eine Antwort von den technischen Teams von Dell EMC einholen können.
- Weitere Informationen zur internationalen Standardisierung von SMART-Werten und anderen SCSI-Speicherschnittstellen finden Sie hier auf der Homepage des T10 Technical Committee.
- Smartmontools ist eine Reihe von Dienstprogrammen zur Steuerung und Überwachung von Computerspeichersystemen mithilfe des SMART-Systems, das in den meisten modernen ATA-, Serial ATA-, SCSI/SAS- und NVMe-Festplatten integriert ist. Es handelt sich nicht um ein DellEMC Tool. Weitere Informationen zu Smartmontools finden Sie hier.