Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

PowerEdgeサーバの仮想ディスクで破損(不良ブロック)を処理する方法(英語)

Summary: PERCコントローラーを搭載したPowerEdgeサーバーのHDD上の不良ブロック(パンクチャ)のトラブルシューティング手順。バックアップが可能でない場合は特に、次の情報が、影響を受ける仮想ドライブを最適な状態に戻すのに役立つ場合があります。

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

-

Cause

-

Resolution

この文書では、PERCコントローラーを搭載したPowerEdgeサーバーのHDD上の不良ブロック(パンクチャ)のトラブルシューティング手順について説明します。バックアップが可能でない場合は特に、次の情報が、影響を受ける仮想ドライブを最適な状態に戻すのに役立つ場合があります。



目次:

  1. 障害の説明

  2. 原因

  3. 問題を解決するための手順

  4. その他の情報


 



1.障害の説明

 

障害1:


OpenManage Server Administrator(OMSA)が、仮想ディスクの前面に赤い十字を示しています(図1)。  

SLN111146_en_US__11343098652871.1
図1: ステータスが赤い十字の仮想ディスク(例:H800)

SLN111146_en_US__2icon 注:Dell OpenManage Server Administrator(OMSA)は、完全な1対1のシステム管理ソリューションを提供します。OMSAは、次の2つのアプリケーションに分類できます。
- 統合 - Webブラウザーベースのグラフィカル ユーザー インターフェイス(GUI)
- コマンド ライン インターフェイス(CLI) - オペレーティング システム経由


 


障害2:


Windowsシステム ログにBad Blockエラーが表示される(図2)。  

SLN111146_en_US__31343098674763.2 
図2:Windowsシステム ログでの不良ブロック エラーの表示
 


 


障害3:


RAIDコントローラー ログ(TTYLOG)に、次のようなエラーが表示されます。  

02/26/15 13:43:39: EVT#131878-02/26/15 13:43:39: 97=Puncturing bad block on PD XX(e0x20/s2) at 180ca4a1f

Warning: コントローラー ログ(TTYLOG)にエラーが表示されないことがあります。

 



2.原因:


RAIDアレイもデータエラーの影響を受けます。  RAIDコントローラおよびハードドライブのファームウェアには、多くの種類のデータエラーを検知して、アレイ/ドライブに書き込む前に修正する機能が備わっています。  古いファームウェアを使用すると、最新のファームウェア バージョンで使用可能なエラー処理/エラー訂正機能がないため、アレイ/ドライブに誤ったデータが書き込まれる可能性があります。
データ エラーは、物理的な不良ブロックが原因で発生する可能性もあります。  たとえば、回転しているプラッタに読み取り/書き込みヘッドがぶつかった(ヘッドクラッシュした)ときに、不正ブロックが発生することがあります。  また、プラッタの特定箇所で、ビットを磁気的に保持する能力が徐々に劣化して、不正ブロックになることもあります。  プラッタの劣化により発生した不正ブロックは、正しく読み取りできることもあります。  このような不正ブロックは、間欠的に検知される場合があります。確実に検知するには、ドライブに対する拡張診断が必要です。  

不正ブロック、つまり不正な論理ブロックアドレス(LBA)は、論理データエラーによって発生することもあります。  これは、書き込みの成功が報告されているにもかかわらず、データがドライブに不正確に書き込まれたときに発生します。  また、ドライブに正常に保存されているデータが意図せず変更されることがあります。  一例として「ビットフリップ」があります。これは、読み取り/書き込みヘッドがデータ上を通過したときや、近くの場所に書き込みが行われたときに、0と1で構成されるデータが別の値に変化することで発生します。  このような状況が発生すると、データの「コンシステンシー」が失われます。  特定ブロックのデータの値が元の値と異なっているので、データのチェックサムが一致しなくなる可能性があります。  物理LBAは正常であり、正常に書き込むことができますが、現在は誤ったデータを保持しているので、不良ブロックとして解釈されることがあります。

詳細については、「RAIDアレイにおける多重障害およびパンクチャ」に関する記事を参照してください。
 



3.問題を解決するための手順:
 

SLN111146_en_US__2icon メモ: 仮想ディスク上の現在のデータは破損しているため、削除する必要があります
  1. 検証済みのデータ バックアップをファイル レベルで作成します
     

    • ブロック ベースのバックアップでは、問題が転送されます
    • ファイル レベルのバックアップは破損したファイルを示します(これらのファイルはバックアップできないはずです)
    • パンクチャ ストライプがすでに設置されている場合、すべてのデータを保持できるという100 %の保証はありません
     

     

  2. 障害の予測が表示されているすべての障害ドライブが交換されていることを確認します
     

  3. 仮想ディスクを削除して再作成します
     

    • この手順で、VDからすべてのデータが削除されます
    • アレイを削除します
    • 必要に応じてアレイを再作成します
     

     

  4. VDの完全な初期化を実行します
     

    • 高速初期化が選択されていないことを確認します
    • 問題を修正できるのは、フル(=低速)の初期化だけです
     

     

  5. 新たに作成された仮想ディスクの整合性チェックを実行します
     

    • 整合性チェックがエラーなしで完了した場合、アレイは正常な状態になりパンクチャが解消されています
     

     

  6. 正常なVDにデータを復元できます
     

  7. 推奨事項:すべてのハード ディスクのファームウェアを最新バージョンにアップグレードします
     



4.その他の情報

OMSAには、不良ブロックの警告をクリアする機能があります。不良ブロックをクリアするには、次の手順をお勧めします。

  • 検証]オプションを選択して仮想ディスクのバックアップを実行すると、次の2つのシナリオが発生する可能性があります。

    • バックアップ操作が1つ以上のファイルで失敗します。この場合は、以前のバックアップからファイルを復元します。ファイルを復元したら、次の手順に進みます。
    • バックアップ操作がエラーなしで完了します。これは、仮想ディスクの書き込まれた部分に不良ブロックがないことを示しています。
    SLN111146_en_US__2icon 注:依然として不良ブロックの警告が表示される場合、不良ブロックはデータ以外の領域にあります。

     
  • Patrol Read(OMSAの仮想ディスク タスク内)を実行し、システム イベント ログを確認して、新しい不良ブロックが検出されないことを確認します。不良ブロックがまだ存在している場合は、次のステップに進みます。そうでない場合は、条件がクリアされます。

    SLN111146_en_US__2icon 注:このアクションを手動で実行するオプションがOMSAに表示される前に、自動巡回読み込みを非アクティブ化する必要があります。

     
  • これらの不良ブロックをクリアするには、[Clear Virtual Disk Bad Blocks]タスクを実行します。このタスクは、OMSA GUIで実行することも、以下のcliコマンドを使用することもできます:
    omconfig storage vdisk action=clearvdbadblocks controller=id vdisk=id

    SLN111146_en_US__2icon 注:コントローラーIDと仮想ディスクIDの値を取得するには、次のように入力します。 omreport storage controller を選択してコントローラ ID を表示し、 omreport storage vdisk controller=ID 仮想ディスクの ID を表示します

     

Affected Products

Servers
Article Properties
Article Number: 000139277
Article Type: Solution
Last Modified: 18 Nov 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.