目次
1.概要
2.説明
3.ソリューション
4.詳細情報
S.M.A.R.T.(自己監視、分析、レポート作成テクノロジー、多くの場合SMARTとして記述)は、ハード ドライブとソリッド ステート ドライブの正常性監視システムで、国際的に標準化されています。
SMARTの主な機能は、差し迫ったハードウェア障害を予測し、障害が発生する前にハードウェアを交換してデータの整合性を維持できるようにすることを目的として、ドライブの信頼性に関するさまざまなインジケーターを検出して報告することです。
Dell EMCは、これらの価値の解釈において、ハードドライブ ベンダーと協力しています。
いくつかのエンタープライズ ハード ドライブのSMARTステータスを確認したところ、ECC(エラー修正コード)訂正率の高い読み取りと検証がいくつかのモデルで観察されました。これらの値を他のハード ドライブと比較した場合、特定のハード ドライブの一部のモデルでは、ECCの訂正がゼロとして報告されるような他のハード ドライブよりもはるかに高いエラー率を示しているように見えることがあります。場合によっては、このエラー率は数百万のECCの訂正として表示され、より多くのI/Oトランザクションが発生すると急速に増加する可能性があります。
このような状況の例を以下に示します。この例は、Linux OSで「smartctl -a /dev/sdX」コマンドを実行することによって収集されました。
図1:エラー カウンター ログ
注:Smartctlアプリケーションは、物理ディスクの正常性を調べるためのオープンソース ツールセットであるsmartmontoolsのコンポーネントです。
注:エンタープライズ ハードドライブによって表示されてsmartmontoolsなどのサードパーティー製ユーティリティーによって解釈されたSMARTログは、デバイスのECCエラーの実際の数を表していない可能性があります。
SMART仕様によって、ベンダーはこれらの上記の例に示すようなカウンターを情報提供を目的として提供できます。カウンターは、必ずしもECCロジック内のソフトまたはハード フォールトの数ではありません。これにより、各ドライブのベンダーは、使用可能なSMARTフィールドに表示される内容に対して柔軟性を持つことができます。一部のベンダーでは、ECCの読み取りまたは検証のカテゴリーにエラー データは表示されません。上の例では、ベンダーがECC機能を監視するためにカウンターを使用することを選択しています。提示されている値は、エラー率を表していません。同様に、他のディスクと比較して一部のディスクで発生するイベントの割合が高くても、パフォーマンスの問題が発生しているわけではありません。
注:SMARTパラメーターは、類似したモデルとファームウェアのみで比較されるべきで、ベンダーまたはモデルの混合インストール ベースで比較することはできません。
特定のエンタープライズHDDのモデルの正常性カウンターに関連して特定のお問い合わせがある場合は、サポート担当者に連絡してDell EMCのエンジニアリング チームから回答を得てください。
- SMARTバリューおよびその他のSCSIストレージ インターフェイスの国際標準化に関する詳細については、こちらにあるT10テクニカル委員会のホームページを参照してください。
- Smartmontoolsは、最新のATA、シリアルATA、SCSI/SAS、NVMeハード ドライブの大多数に組み込まれた、自己監視、分析、およびレポート作成のテクノロジー システムを使用してコンピューターのストレージ システムを制御およびモニターするための一連のユーティリティー プログラムです。これはDell EMCツールではありません。Smartmontoolsの詳細については、こちらを参照してください。