Symptoms
Brocade porterrshow出力の解釈方法
porterrshowカウンターの意味するもの
Brocade SANスイッチのporterrshow出力(ポート エラー)と、考えられるエラーの原因を解釈し、説明します。
カウンターが増加した場合の対応については、KB記事
「
Connectrix:Fibre Channelノードをトラブルシューティングして、ポートまたはSFP通信の問題を排除する方法(セルフヘルプ) 」
のコピーを参照してください(このKBのメモ セクションに記載されています)。
/fabos/cliexec/porterrshow:
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
0: 575.2m 2.1g 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
1: 576.7m 2.1g 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
2: 611.3m 2.1g 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
3: 613.6m 2.1g 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0
このコマンドは、すべてのポートのエラー サマリーを表示します。
1ポートにつき1行が出力され、エラー カウンターが1、1000(数字の後にkが付く)、または100万(数字の後にmが付く)の単位で表示されます。
Cause
なし
Resolution
Frames tx
送信したフレーム数:ポートが送信したフレームの数。この数値は、エラー カウンターのベースラインとなる統計です。
Frames rx
受信したフレーム数:ポートが送信したフレームの数。この数値は、エラー カウンターのベースラインとなる統計です。
Enc in
フレーム内のエンコーディング エラー数:(RX)。フレーム境界の内側で発生した8b/10bエンコーディング エラーの数。このカウンターは通常ゼロ値ですが、正常なリンクで時折エラーが発生し、ゼロ以外の結果になることがあります。フレームを連続して受信するリンクのリンクビット エラー レート仕様に最小限準拠すると、1 Gb/秒で20分に1回程度のエラーを許容することになります。また、関連付けられているNxポートの再初期化と再起動も、これらのエラーの原因となります。これらのエラーは、LLIエラーの合計に含まれます。
Crc err
巡回冗長検査エラーのあるフレーム数:(RX)。巡回冗長検査に失敗したフレームの数。巡回冗長検査(CRC)は、データ フィールドの直後に続く4バイトのフィールドであり、フレーム ヘッダーとデータ フィールドのデータの整合性を検証するために使用されます。SOF (= Start-Of-Frame)およびEOF (= End-Of-Frame)区切り文字はCRC検証に含めないでください。CRCフィールドは、送信のためにエンコードする前、および受信時にデコードした後に、フレーム ヘッダーとデータ フィールドで計算される必要があります。CRCフィールドはワード境界にアラインされなければなりません。CRC計算のために、最初に転送されたビットに対応するワード アラインされた4バイトのフィールドのビットが最上位ビットとなります。CRCに失敗したフレームは記録されますが変更はされず、送信先デバイスはこのフレームを拒否および/または再要求する責任を負います。統計的には、enc outエラーだけでもケーブルの問題を示し、enc outとcrc errの組み合わせではGBICまたはSFPの問題を示します。これらのエラーは、LLIエラーの合計に含まれます
crc g_eof
正常なEOF (End Of Frame)を受信したCRC(Rx)。正常なEOFを含むCRCが検出されると、スイッチはcrc g_eofカウンターの値を増やし、他のポートがこのCRCフレームをカウントしないようにこのフレームにタグ付けし、このフレームを転送します。
これにより、正常なEOFを含むCRCフレームを素早くたどって、発信元のポートに到達できます。
Too short
「too short」カウンターは、SOF (Start of Frame)とEOF (End of Frame)で囲まれたフレームを受信し、SOFとEOFの間のワード数が7ワード(ヘッダー6ワード+ CRC 1ワード)未満(すなわちSOFとEOFを含めて38バイト(48ではない))の場合に増分されるエラー統計カウンターです。これは、送信側または信頼性の低いリンクが原因である可能性があります。データ フレーム サイズは0~2112の変数です。これらのエラーは、LLIエラーの合計に含まれます
Too long
最大長よりも長いフレーム数:最大フレーム サイズ(36バイト + データ フレーム サイズ)よりも長いフレームの数。データ フレーム サイズは0~2112の変数です。これらのエラーは、LLIエラーの合計に含まれます。FCフレームは最大2,148バイトです。EOFが破損しているか、データ生成が正しくない場合は、too longエラーが生成されます。
Bad eof
end-of-frame区切り文字が正しくないフレーム数:End-of-Frame (EOF)区切り文字は、CRCの直後に続く順序付けされたセットです。loss-of-synchronizationエラーの後、continuous-modeアラインメントを行うと、受信側が動作している間、受信ビット ストリームの任意の時点でワード アラインメントを再確立できます。このような再アラインメントによって、コード違反が発生しその後loss of Synchronizationが発生することがよくあります(ただし、保証はできません)。特定の条件下では、loss of Synchronizationエラーを出すことなく、受信ビット ストリームの再アラインメントを行える場合があります。受信フレーム内でこのような再アラインメントが行われた場合、結果として発生するエラー状態の検出は、上位レベルの機能(例:無効なCRC、EOF区切り文字の欠落)に依存します。
EOF区切り文字は、フレーム コンテンツの終端を示し、その後にアイドル状態が続くものとします。EOF区切り文字には3つのカテゴリーがあります。区切り文字のカテゴリーの1つは、フレームが送信者の観点からは有効であり、受信者の観点からは潜在的に有効であることを示します。2つ目のカテゴリーは、フレーム コンテンツが有効であることを示します。このカテゴリーは、完全なフレームを受信し、そのフレームを別の送信先に転送する前にデコードするFポートによってのみ使用されます。3つ目のカテゴリーは、フレームのコンテンツが破損しており、転送中にフレームが切り捨てられたことを示します。3つ目のカテゴリーは、NポートとFポートの両方で、送信側の障害など、フレーム全体を正常に転送できない内部誤動作を示すために使用されます。これらのエラーは、LLIエラーの合計に含まれます。
enc out
8ビット/10ビットのエンコーディング エラーが、FCフレーム外のワード(順序付けられたセット)で発生しました。フレーム外のワードはエンコードされ、このエンコードが破損していたりエラーが検出されたりした場合はenc outが生成されます。
フレーム外でのエンコーディング エラー:フレーム境界の外側で発生した8b/10bエンコーディング エラーの数。このカウンターは、リンクの初期化中にゼロ以外の値になる可能性がありますが、リンク ビット エラー レートで許容される速度よりも速く増加する場合(1 Gb/秒で20分ごとに1回)、問題があることを示します。これは通常、破損したプリミティブ シーケンスが原因で発生します。これは次のとおりです。LIP f7、f7
メモ: ユーザーがホストを再起動したり、ストレージ サブシステムの電源を入れ直したり、ケーブルを切断/再接続したり、portDisable/portEnableコマンドを呼び出したりしてポートをダウン/アップするたびに、loss sig、loss sync、およびenc outエラーが発生することが予想されます。また、2GBitスイッチが接続されているデバイスと接続速度をネゴシエートしている間にも、これらのエラーが増加しているという事実も重要です。統計的には、enc outエラーだけでもケーブルの問題を示し、enc outとcrc errの組み合わせではSFPの問題を示します。これらのエラーは、LLIエラーの合計に含まれます。
Disc c3
クラス3の破棄フレーム(Rx)の数。カウンターには、portstatshowコマンドによって報告された次のC3破棄カウンターの合計が含まれます。
er_rx_c3_timeout、er_tx_c2_timeout、er_c2_dest_unreach、およびer_other_disc
デバイスが最初にFLOGIせずにフレームを送信したり、無効送信先でフレームを送信したりすると、スイッチでクラス3破棄エラーが生成される可能性があります。このエラーは、このような破棄が発生したことを報告しています。
クラス3フレームは、タイムアウト、無効、または到達不能な送信先のために破棄されることがあります。このカウンターは、通常のオペレーション中に増分されます。また、このカウンターはポートの輻輳の影響を示すためにも使用できます。これは、連続するS-IDおよびD-IDからの良好なフレームがポート間で直接ルーティングされず、例外フレームは内部ポートを介してルーティングされることを意味します(通常はASICのポート間ルーティングでは発生しないはずですが、D-IDポートがバッファー フル状態に陥り、それ以上のフレームを受け入れることができない場合に発生します)。また、ISLワークロードが高いために送信先がブロックされている(つまり、BB Credit Buffer = 0の状態が長時間続く)場合、バッファーのフル状態が発生し、その結果S-IDポートが(極端な状況において)タイムアウト状態に陥って、disc c3カウンターが増加する可能性があります。これらのエラーは、LLIエラーの合計に含まれます。
さらに詳細な情報を以下に示します。ポートが一度に受信できるフレームは1つだけです(xWDM接続の外側では、光ケーブルに2つの光パルスを同時に入射することはできません)。したがって、2つの光源がポートを共有しようとすると、1つの光源が通過し、2番目の光源が順番を待つというアービトレーション アルゴリズムを使用する必要があります。最初の光源が完了すると、2番目の光源を入射できます。つまり、光源は50%の使用率(すなわちビジー時間と準備完了時間が等しい)でしか実行できません。光源がD-IDの速度でデータをストリーミングできる場合(最近では多くのHBAで可能)、他の同程度の速度のHBAで試した場合、パフォーマンスが50%低下します。
er_unreachableは、送信先に到達できなかった、または送信先上のデバイスのオフライン/オンラインが原因で記録された破棄物です。
er_other_discは、他の定義された破棄フレームのどのカテゴリーにも該当しない実際の破棄物です。Brocadeによると、それらは軽微であり、パフォーマンスには影響を与えません。
Link fail
リンク障害(LF1またはLF2の状態):ポートがLink fail1および/またはLink fail 2状態に到達した回数。受信(Rx)。ポートがタイムアウト期間(R_T_TOV)を超えてLR受信状態のままである場合は、リンク リセット プロトコル タイムアウトが検出され、リンク障害状態になります(NOS送信状態になります)。
また、このリンク障害は、オフライン状態でない間に、R_T_TOV値よりも長く続く信号の損失または同期の損失が検出されたことを示します。
Loss sync
同期の損失:同期が失われた回数。ビットまたは伝送-ワード境界での同期の失敗は個別に識別できず、loss-of synchronizationエラーが発生します。
メモ: ユーザーがホストを再起動したり、ストレージ サブシステムの電源を入れ直したり、ケーブルを切断/再接続したり、portDisable/portEnableコマンドを呼び出したりしてポートをダウン/アップするたびに、「loss sig」、「loss sync」、および「enc out」エラーが発生することが予想されます(loss sig = 信号の損失:信号が失われた回数)。動作中の受信側がloss-of-signal状態を認識すると、Loss-Of-Synchronization状態に入ります(受信側が現在その状態でない場合)。受信側は、次のいずれかの条件が成立するまで、この状態のままになります。loss-of-signal状態が修正され、同期が回復されます。または、受信側がリセットされます。
Loss sig
信号の損失を受信した回数。信号が送信されたが、同じポートで受信されていない場合に発生します。
frjt
F_RJTで拒否されたフレーム:ファブリック ポート拒否フレームの数。これらは、フレームの配信が拒否されていることを示しています。F_RJTを発行する理由には、以下のようなものがあります。クラスがサポートされていない、無効なヘッダー フィールド、およびN-Portが利用できない
fbsy
ファブリックがE_D_TOVフレーム内でクラス2フレームを提供できない場合、フレームは破棄され、F_BSYが返されます。(Tx) F_BSYでビジー状態になっているフレーム数:ファブリック ポート ビジー フレーム。このフレームはファブリックによって発行され、ファブリックまたは送信先Nポートがビジー状態であるため、特定の配信ができないことを示します。
c3-timeout tx
タイムアウトのために転送ポートで破棄された送信クラス3フレームの数(プラットフォームおよびポートに固有)。
c3-timeout rx
このポートで受信され、タイムアウトのために転送ポートで破棄された受信クラス3フレームの数(プラットフォームおよびポートに固有)。
pcs err
Physical Coding Sublayer (PCS)ブロック エラーの数。このカウンターは、10 Gbpsまたは16 Gbpsポートのエンコーディング違反を記録します。
porterrshow ER_PCS_BLKカウンターでは、これは10 Gbpsまたは16 Gbpsポートをサポートするプラットフォーム(6505/6510/6520/DCX-8510)にのみ適用され、GEN5プラットフォームであるCondr3 ASICで導入されました。このカウンターは、8 GB/4 GBリンクのenc_outと同等であり、10 GBおよび16 GBの速度でのみ使用されます。
10 GBおよび16 Gbリンクは、データ転送に8 B/10 Bではなく64 B/66 Bエンコーディングを使用し、「pcs err」(=er_pcs_blk)カウンターには、デコード中に検出された10 Gbpsまたは16 Gbpsポートのエンコーディング違反が記録されます。
uncor err
修正不可能なForward Error Correction (FEC)の数。
このビデオを参照してください。
最も一般的なカウンターのBROCADEの例。
例1 LINK FAILとLOSS SYNCを伴うENC OUT:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計をクリアし(https://support.emc.com/kb/304525)、4~6時間後にデータを再取得してください。
エラーから、link fail、loss of sync、さらにenc outエラーが確認できます。これにはloss sigエラーも含まれる場合があります。
これらのエラーの組み合わせは、通常はホストの再起動またはスイッチの外部でのリンク リセットを示しています。enc outエラーは、リンク初期化の一環である速度ネゴシエーション中に発生します。
想定されるアクション:
ポートに接続されたデバイスがオフライン/オンラインになる正当な理由(ホストの再起動)があったことを確認します。そうでない場合は、SRを上げます。
例2 ENC OUT:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再取得します。
関連エラーのないEnc outエラーは、ケーブルが汚れていることを示します。
想定されるアクション:
このポートに接続されているケーブルとSFP、および接続されているデバイスのすべての光学面を点検し、クリーニングします。
例3 CRCおよびCRC G_EOF:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再取得します。
フレームは不正なCRCでスイッチ ポートに入っていますが、フレームの終わりはまだ良好とマークされています。
これは、不良フレームを登録する最初のポートであることを示しており、この特定のポートのSFP/ケーブル/接続デバイス インターフェイスのいずれかに問題があることを示しています。
想定されるアクション:
解決策のデフォルトのアクションを参照してください。
ISLポートの場合は、
statsclear コマンドと
slotstatsclear コマンドを使用して統計情報をクリアし、4~6時間待ってから、両方のスイッチから
supportsaves を収集し、通常のトラブルシューティングのためにSRを作成します。
例4 CRC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合にのみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計をクリアし(https://support.emc.com/kb/304525)、4~6時間後にデータを再取得します。
ポートは、不良CRCフレームでスイッチに入るフレームを記録していますが、そのフレームはすでに不良としてマークされています。通常、これはISLおよびNPIV Fポートで確認できます。
期待されるアクション:
CRCエラーがNPIVポートに記録されている場合は、デバイスをメンテナンスするベンダーにデバイスの調査を依頼してください!
ISLポートの場合は、例3のように、ファブリック内のすべてのポートを調べてCRC g_oefとアクションを記録していないか確認します。
例5 LINK FAILとLOSS SYNCを伴うPCS ERR:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報をクリアし(https://support.emc.com/kb/304525)、4~6時間後にデータを再取得します。
これは、10 Gbpsまたは16 Gbpsポートをサポートするプラットフォーム(6505/6510/6520/DCX-8510)にのみ適用され、GEN5プラットフォームであるCondor3 ASICで導入されました。ER_PCS_BLKは、Physical Coding Sublayer (PCS)ブロック エラーの数を示しています。このカウンターは、8 GBまたは4 GBリンクのenc_outと同等であり、10 GBおよび16GBの速度でのみ使用されます。
エラーには、link fail、loss of sync、pcs errがあり、loss sigエラーも含まれる場合があります。
これらのエラーの組み合わせは、通常、スイッチの外部でのホストの再起動またはリンクのリセットを示しています。
pcs errエラーは、リンク初期化の一環として速度ネゴシエーション中に発生します。
想定されるアクション:
ポートに接続されたデバイスが、オフライン/オンラインになる正当な理由(ホストの再起動)があったことを確認します。そうでない場合は、SRを上げます。
例6 PCS ERR:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再取得します。
関連エラーのないPCS ERRエラーは、ケーブルが汚れていることを示します。
想定されるアクション:
このポートに接続されているケーブルとSFP、および接続されているデバイスのすべての光学面を点検し、クリーニングします。
例7 C3timoutとDisc c3:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 2.4k 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再取得します。
C3TIMEOUTは、このポートでデフォルトのタイムアウトである500ミリ秒でフレームが破棄されることを示します。
TX - このスイッチ ポートからフレームを送信できません。
RX - フレームはこのスイッチ ポートに受け入れられず、デフォルトのタイムアウト(500ミリ秒)で破棄されます。
想定されるアクション:
これらのエラーは、ファブリックまたは接続されたデバイスの性能に問題がある可能性を示しています。以下のKB記事を調査の起点として参照してください。
464206:「
SANのパフォーマンスに関する問題(低速ドレイン、輻輳、オーバーサブスクリプション)(英語) 」
および
464027:
「Connectrix:混雑拡散ナレッジ マップ(英語) 」
例8 Disc c3:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 0 0 0
一般的な理由:
過去24時間以内にポート統計がクリアされている場合のみ有効です。それ以外の場合は、これらのカウンターを履歴として分類します。ポート統計情報(https://support.emc.com/kb/304525)をクリアし、4~6時間後にデータを再取得します。
「到達不能」、「その他」、または「ルーティング不可能」なフレームの蓄積が破棄されます(破棄の詳細については、portstatsshowコマンドの出力を参照してください)。
想定されるアクション:
C3は単独で破棄します。一般的にSANには影響しません。
例9 Uncorr err:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
xx: 1.1g 468.4m 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 48
FECによって修正されなかったブロックの数
このエラーに付随して、CRC、enc_outおよびbad eof (pcs err)が発生している場合、データ フレームと順序付けされたセットにそれぞれ影響を与える可能性があります(そのため、r_rdyが失われ、クレジットが枯渇する可能性があります)。これらのエラーに関して推奨されたアクティビティーに従ってください。
これらのいずれも増加していない場合、修正されていないエラーの影響は最小限ですが、リンクがエラー フリーではないことを示しており、ケーブルまたはSFPに問題が発生している可能性があります。
uncorr errのみ発生している場合は、最初のステップとしてケーブルをテストし、コネクターをクリーニングする必要があります。
Affected Products
Connectrix
Products
Connectrix, Connectrix DS-300B, Connectrix DS-5100B, Connectrix DS-5300B, Connectrix DS-6505B, Connectrix DS-6510B, Connectrix DS-6620B, Connectrix ED-DCX6-4B, Connectrix ED-DCX6-8B, Connectrix ED-DCX8510-4B, Connectrix ED-DCX8510-8B
, Connectrix MP-7500B, Connectrix MP-7800B, Connectrix MP-8000B
...
View More
View Less