課題
-
接続されているホストの読み取り/書き込みパフォーマンスが低い、またはレスポンス タイムが高い。
-
ホスト アプリケーションのレスポンス タイムが増加しているか、または許容上限を超えている。
-
パフォーマンス分析が必要なDell Unityアレイのパフォーマンスの問題。
パフォーマンスの問題には、ネットワーク構成、輻輳、ホスト構成、ハードウェア障害、ディスク競合(同じドライブを共有する複数のビジーLUN)、ストレージ アレイの使用率の最大化など、さまざまな原因が考えられます。
Unityテクニカル サポートは、次の情報が提供されるまで、パフォーマンスの問題を完全に調査およびトラブルシューティングすることはできません。
- サービス データ ファイル(データ コレクション)
- UPAファイル(Unityパフォーマンス アーカイブ)
- お客様の環境で発生する症状の詳細な説明
このLKBの情報を迅速に提供しないと、解決時間が長くなる可能性があります。
パフォーマンスの問題(症状、タイム スタンプなど)の詳細は、エンジニアが(原因ではなく)問題を見つけるために数時間を費やすのではなく、重点を置く場所(時間/LUN/ホストなど)を把握するために重要です。この詳細がなければ、時間が問題の検索に費やされ、一般的なパフォーマンス統計のみを分析できる場合があります。
スコープ
カスタマー サポート サービスは、パフォーマンス ケースを調査して、お客様のサイトに影響を与えている問題を特定します。パフォーマンス チューニング(ホストまたはアプリケーションのピーク パフォーマンスを達成するため)と再構成は、ストレージ管理者またはソリューション アーキテクトのタスクであるため、故障修理サービス リクエストでは処理されません。
アレイ上の現在のワークロード レベルのレポートの要求など、実際の問題を伴わないサービス リクエストは、サポートの範囲外です。セルフヘルプまたはアレイ上のワークロードのレベルを判断するためにサポートが必要な場合は、Live Opticsサービスを使用できます。このオプションの詳細については、次の記事を参照してください。
詳細なパフォーマンス分析のためのデータと情報の要件
各イベントについて、テクニカル サポートは
インシデントのタイム フレームをカバーする次のログと情報を必要とします。
- 問題が発生した直後に生成されるサービス データ ファイル(データ 収集とも呼ばれます)。
- レプリケーションが使用中の場合は、両方のアレイからのデータ コレクションとUPAファイルが必要です。
- 問題が発生した期間全体をカバーするUnity UPAファイル(Unityパフォーマンス アーカイブ)。
- 問題がアレイの外部にあるように見える場合は、ホストグラブとスイッチのログも必要になる場合があります。
- Unityネットワーク トレースも必要になる場合があります。
ブロックの問題
- 明確で詳細な問題の説明を入力します。
- 問題が発生したのはいつですか? (日付/時刻&タイム ゾーン)
- 影響を受けるLUNはどれですか?
- これは非常に重要です。検索を絞り込む必要があります。
- 問題が発生しているLUNで、データ削減または高度な重複排除が有効になっていますか? データ削減は他のLUNに対して有効になっていますか? (「 Unityのベスト プラクティス 」ホワイト ペーパー「 CPUの利用率 」セクション( 9ページ )を参照してください)
- レプリケーションは使用されていますか? レプリケーションのRPOに関する情報と、レプリケーションが一時停止された場合にパフォーマンスの問題が改善されるかどうかを説明してください。
- アクティブなデータが利用できない場合は、存在しますか、または存在していましたか?
- 指定された時間に他に何か実行されていますか? (バックアップ、ジョブ、バッチ、ウイルス スキャン、ホスト ディスク最適化(TRIM/UNMAP)など)
- 何かが正常に動作していない場合は、動作したことはありますか? または、これは新しい実装/セットアップの一部ですか? 最近、新しいアプリケーションやホストが追加されましたか?
- パフォーマンスはどのように測定されますか、またはどのような影響がありますか? ホスト側で遅延またはエラーが発生していますか? エンド ユーザーは低速を報告していますか?
- SAN環境(ホスト、スイッチ、アレイ)の最近の変更はありますか?
- 影響(影響を受けるアプリケーション、影響を受けるサーバーの数、影響を受けるユーザーの数など)
- どのくらいの頻度で問題が発生しますか? (定期的/定期的/1回/ランダム)
- 影響を受けるホストの名前は何ですか?
- どのようなトポロジーが使用されていますか? FC、iSCSI、またはEthernetですか? (iSCSIを使用する場合、すべてのホストでTCP遅延ACKが無効になっている 必要があります 。KB 000079979を参照し、TCP遅延ACKを検索してください)。
- 接続に問題がある場合は、トポロジー 図が必要になる可能性があります。
- ネットワークに既知の問題が同時に存在しますか、または最近ネットワークがアップグレードされていますか? また、iSCSIが内部LANで使用されておらず、使用されているスイッチがエンタープライズ クラスのスイッチである必要があることを確認します。
ファイルの問題
- 明確で詳細な問題の説明を入力します。
- 関連する特定のプロトコルは何ですか?
- Example: NFS(バージョン)、CIFS(バージョン)、NDMP、iSCSI、FTPなど
- 問題は、特定のエクスポート/共有、ファイル システム/LUNに関連していますか?
- 問題は何時に発生しますか? (日付/時刻&タイム ゾーン)
- その時点でアクティブなワークロードは何ですか?
- 例:ログイン、ログアウト、バックアップ、バッチ ジョブなど
- 関連するホストは何ですか?
- Example: バックアップ、VM、ワークステーション、サーバーなど?
- 可能な限りアプリケーションの詳細を取得します。
- ネットワーク構成はどのようになっていますか?
- 特定のインターフェイス/NICの詳細を提供します。
- ネットワーク インターフェイスは別々のNICで分離されていますか?
- 例:独自の/単一NIC上のレプリケーション トラフィック
サービス データ ファイルの収集(データ 収集)
サービス データ ファイル(データ コレクション)を収集するには、「 LKB 000023676 」を参照してください。アレイ上で実行中のサービス データ ファイルからの出力ファイルは、詳細なアレイ構成と、パフォーマンスに影響を与えた可能性のあるアレイで発生したイベントを表示するために必要です。イベントが発生した後、 できるだけ早く サービス データ ファイル(データ 収集)を収集することをお勧めします。
サービス データ ファイルには、最後に 完了 したUPAファイル(1時間)と使用可能な-tmp.archive UPAファイルのみが含まれていることに注意してください。多くの場合、これは適切なパフォーマンス レビューには十分な情報ではなく、追加のUPAが必要になります。
サービス データ ファイル(データ コレクション)内でUPAファイルを検索するには、 spx\cmd_outputs\metrics\ に移動します。
UPAファイルの収集
- サポートは、追加のUPAファイルを要求する場合があります(サービス データ ファイル(データ コレクション)で使用可能なUPAに対して)。
- サービス データ ファイル(データ コレクション)とは異なり、アレイには最大48時間のUPAファイルが格納されます。
- UPAファイルは次の例のようになります。各ファイル名には、ファイル内の 最初 のデータ ポイントの日付と時刻が含まれています。間隔は10秒で、1時間から10秒を引いた時間をカバーします。ファイル名の日付と時刻はUTC/GMTです。
- 次の例の最後のUPAファイルは、最新のアーカイブ(-tmp.archive)であることに注意してください。これには現在のパフォーマンス データが含まれています。アレイからコピーして(SSH/CLI経由のみ)、最新のデータを確認できます。このファイルを使用すると、次の1時間まで待つ必要なく、パフォーマンス イベントを表示できます。
Dell Unityアレイに保存されているUPAファイルの例:
01/05/2017 10:59 AM 11,017,216 _default_20170105_150000.archive
01/05/2017 11:59 AM 11,017,216 _default_20170105_160000.archive
01/05/2017 0101 :00 PM 11,017,216 _default_20170105_170000.archive
01/05/2017 01:59 PM 10,983,424 _default_20170105_180000.archive
01/05/2017 02:45 PM 8,308,736 _default_20170105_190000-tmp.archive
UPAファイルの収集には、次の2つの方法(CLIとUnisphere/GUI)を使用できます。
Unisphere/GUI経由
オプション1: Unisphereリスト
このオプションは、Unity OE 4.2以降でのみ使用できます。使用可能なすべてのUPAはここには表示されません。GUI(Unisphere)には制限があり、使用可能なファイルの一定数のみを一覧表示できます。必要なUPAが表示されない場合は、オプション2に移動するか、SSH/CLIを使用します。
オプション2: Unisphereの時間範囲
- システムが使用可能なUPAを取得するための時間範囲を選択できます。
- 必要なログのみがダウンロードされるように、ログを収集する前に問題の時間を確認してください。
- お客様の時間範囲はローカルブラウザーの時刻であり、多くの場合、現在のワークステーション時刻と同じであることに注意してください。
- このオプションは、Unity OE 4.2以降でのみ使用できます。
SSH/CLI経由
また、CLIを使用して、Unityアレイ上のより多くのUPAにアクセスすることもできます(ただし、オプション1のGUI(Unisphere)には表示されません)。
-
ユーザー名「service」とサービス パスワードでログインします。
-
/EMC/backend/metricsluna1/archiveから/cores/service/userに目的のログをコピーします。
-
WinSCPまたは同様のツールを使用して、これらのログをダウンロードします。
ll /EMC/backend/metricsluna1/archive/
cp /EMC/backend/metricsluna1/archive/_default_20230221_180000.archive.gz /cores/service/user
注:現在のUPAのみを収集している場合は、バックエンドで使用可能なUPAファイルが数十個あるため、|tail-10を使用できます。ただし、必要に応じてすべてをリストできます。
ホスト データ コレクション
問題が特定のホストに固有の場合は特に、ホスト グラブ(またはEMCレポート)出力ファイルが必要になる場合があります。
-
https://www.dell.com/support/home/(Dellサポート サイト)に移動し、適切なホストOSの Grab Utility を検索します(例: ESXiホスト グラブ)
-
ユーティリティーとREADMEファイルをダウンロードします。
-
READMEファイルに従って、選択したホスト オペレーティング システム用のユーティリティーを実行します。
スイッチ ログ
パフォーマンスの問題が特定のパスにのみ存在する場合は、スイッチ ログが必要になる場合があります。手順については、次のLKBを参照してください(使用されているモデルに基づきます)。
Brocade/Connectrix
Cisco
-
000191330: MDSスイッチからテクニカル サポート ログを収集する方法を教えてください。https://www.dell.com/support/kbdoc/000191300
-
000010120: 「Connectrix:CLI https://www.dell.com/support/kbdoc/00010120 を使用してCisco MDS 9000ファミリー スイッチからログを収集する方法
ネットワーク トレース キャプチャ(TCPダンプ)
一部のファイル パフォーマンスの問題は、ネットワークの問題に関連している可能性があります。問題の原因を完全に特定するために、サポートがネットワーク トレースを要求する場合があります。手順については、次のLKBを参照してください。
- 000022522: 「Dell EMC Unity:Unityパフォーマンス分析に必要な情報を収集する方法 https://www.dell.com/support/kbdoc/000022522