目錄
1.簡介
2.描述
3.解決方案
4.其他資訊
(S.M.A.R.T.)(自我監控、分析與報告技術 (通常顯示為 SMART) 是一種針對硬碟和固態硬碟 (已通過國際標準化) 的健全狀況監控系統。
SMART 的主要功能是偵測和報告磁碟機可靠性的各種指示燈,目的是預期即將發生的硬體故障,以便在故障前更換硬體,並維護資料的完整性。
Dell EMC 已與我們的硬碟廠商合作,共同解讀這些值。
在檢閱某些 Enterprise 硬碟的 SMART 狀態時發現,可在某些型號上看到高讀取並確認 ECC (錯誤校正碼) 修正率。如果將這些值與其他硬碟進行比較,似乎代表某些特定硬碟的機型錯誤率遠高於其他可能回報為零 ECC 修正的機型。在某些情況下,此錯誤率會顯示為數億個 ECC 修正,而且可能會隨著發生更多的 I/O 交易而快速增加。
以下提供此情況的範例。在 Linux 作業系統下執行命令「smartctl -a /dev/sdX」來收集此範例。
圖 1:錯誤計數器記錄
注意:Smartctl 應用程式是 smartmontools 的元件,這是用於查詢實體磁碟健全狀況的開放原始碼工具集。
注意:由 Enterprise 硬碟顯示並由第三方公用程式 (例如 smartmontools) 解譯的 SMART 記錄可能不代表裝置的實際 ECC 錯誤計數。
SMART 規格可讓廠商提供這些計數器,例如上述範例中所示的計數器,以供參考。計數器不一定是 ECC 邏輯中軟性或硬性故障的計數。這可讓每個磁碟機廠商彈性選擇在可用的 SMART 欄位中顯示的內容。對於某些廠商,ECC 讀取或確認類別中不會顯示任何錯誤資料。在上述範例中,廠商已選擇使用計數器來監控 ECC 功能。顯示的值不代表錯誤率。同樣地,某些磁碟在相較於其他磁碟下事件率較高,這並不表示有效能問題存在。
備註:不應在廠商或機型的混合安裝基礎中比較 SMART 參數;只能比較類似的型號和韌體。
如果您對特定機型 Enterprise HDD 的健全狀況計數器有特定的查詢,請聯絡我們的支援技術人員,由其協助向 Dell EMC 的工程團隊取得答案。
- 如需 SMART 值和其他 SCSI 儲存介面國際標準化的詳細資訊,請參閱位於這裡的 T10 技術委員會首頁。
- Smartmontools 是一套公用程式,可使用內建於最現代化 ATA、序列 ATA、SCSI/SAS 和 NVMe 硬碟的自我監控、分析與報告技術系統來控制和監控電腦儲存系統。它不是 Dell EMC 工具。您可以在這裡找到 Smartmontools 的詳細資訊。