Connectrix řady B: Jak interpretovat výstup příkazu porterrshow Brocade a co znamenají počítadla. Nápověda
Summary:Vysvětlení čítačů v příkazu porterrshow
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Jak interpretovat výstup příkazu porterrshow přepínače Brocade.
Co znamenají čítače porterrshow?
Interpretace a vysvětlení výstupu příkazu porterrshow (chyby portu) přepínačů Brocade SAN a možné příčiny chyb.
Tento příkaz zobrazí souhrn chyb pro všechny porty.
Pro jeden port se zobrazí jeden řádek výstupu a na něm čítače chyb v jednotkách, tisících (číslo je následováno písmenem „k“) nebo milionech (číslo je následováno písmenem „m“).
Cause
Není k dispozici
Resolution
Frames tx Přenesené rámce: Počet rámců přenesených portem. Toto číslo představuje statistiku, která poskytuje výchozí stav pro čítače chyb.
Frames rx Přijaté rámce: Počet rámců přenesených portem. Toto číslo představuje statistiku, která poskytuje výchozí stav pro čítače chyb.
Enc in Chyby při kódování v rámcích: (RX). Počet chyb kódování 8b/10b, ke kterým došlo uvnitř hranic rámce. Tento čítač má obecně nulovou hodnotu, i když se u normálního připojení mohou zobrazit občasné chyby a výsledek bude nenulový. Minimální soulad se specifikací bitové chybovosti připojení v připojení, které nepřetržitě přijímá rámce, by způsobil přibližně jednu chybu každých 20 minut pro 1 Gb/s. Tyto chyby mohou také způsobit opětovné inicializace a restartování souvisejícího portu Nx. Tyto chyby jsou uvedeny v součtu chyb LLI.
Crc err Rámce s chybami Cyclic Redundancy Check: (RX) Počet rámců, které selhaly při kontrole CRC (Cyclic Redundancy Check). Cyclic Redundancy Check (CRC) je čtyřbajtové pole, které musí následovat ihned po datovém poli a používá se k ověření integrity dat záhlaví rámce a datového pole. Oddělovače SOF (= Start-Of-Frame) a EOF (= End-Of-Frame) nesmí být v ověření CRC. Pole CRC se vypočítá v záhlaví rámce a datovém poli před kódováním pro přenos a po dekódování při příjmu. Pole CRC musí být zarovnané na hranici slov. Pro účely výpočtu chyb CRC je bit čtyřbajtového pole zarovnaného podle slov, který odpovídá prvnímu přenesenému bitu, bitem nejvyššího řádu. Rámce, které selžou při kontrole CRC, budou označeny, ale nikoli upraveny, a cílové zařízení ponese odpovědnost za zamítnutí nebo opětovné vyžádání rámce. Statisticky pouze chyby „enc out“ značí problémy s kabelem. Kombinace chyb „enc out“ a „crc err“ značí problémy s GBIC nebo SFP. Tyto chyby jsou uvedeny v součtu chyb LLI.
crc g_eof Kontrola CRC s nezávadným EOF (End Of Frame). (Rx). Když je zjištěna kontrola CRC s nezávadným EOF, přepínač zvýší čítač crc g_eof, označí rámec tak, aby jej nezapočítával žádný jiný port, a rámec přesměruje.
Díky tomu je možné rámec CRC s nezávadným EOF rychle vysledovat k původnímu portu.
Too short Čítač „too short“ počítá statistiky chyb, který se zvyšuje, kdykoli je přijat rámec ohraničený atributy SOF (Start of Frame) a EOF (End of Frame), u něhož platí, že počet slov mezi atributy SOF a EOF je menší než 7 slov (6 slov v záhlaví + 1 slovo v kontrole CRC), tj. 38 bajtů (nikoli 48) včetně atributů SOF a EOF. Příčinou může být vysílač nebo nespolehlivé připojení. Velikost datového rámce je proměnná v rozsahu 0–2112. Tyto chyby jsou uvedeny v součtu chyb LLI.
Too long Rámce delší než maximum: Počet rámců, které jsou delší než maximální velikost rámce (36 bajtů + velikost datového rámce). Velikost datového rámce je proměnná v rozsahu 0–2112. Tyto chyby jsou uvedeny v součtu chyb LLI. Rámce FC mají maximálně 2 148 bajtů. Pokud je atribut EOF poškozený nebo se generují nesprávná data, vygeneruje se chyba „too long“.
Bad eof Rámce se špatnými oddělovači End-of-Frame: Oddělovač End-of-Frame (EOF) je nařízená sada, která bezprostředně následuje po kontrole CRC. Po zobrazení chyby loss-of-synchronization zarovnání continuous-mode alignment umožňuje přepínači znovu obnovit zarovnání slov v jakémkoli okamžiku příchozího bitového toku, když je přijímač v provozu. Toto opětovné zarovnání pravděpodobně (ale ne spolehlivě) povede k narušení kódu a následné ztrátě synchronizace. Za určitých podmínek může být možné znovu zarovnat příchozí bitový tok bez ztráty synchronizace. Pokud k takovému opětovnému zarovnání dojde v přijatém rámci, je zjištění výsledné chyby závislé na funkci vyšší úrovně (např. neplatné CRC, chybějící oddělovač EOF).
Oddělovač EOF musí určit konec obsahu rámce a musí za ním následovat údaje o nečinnosti. Existují tři kategorie oddělovačů EOF. Jedna kategorie oddělovače značí, že rámec je platný z pohledu odesílatelů a potenciálně platný z pohledu příjemce. Druhá kategorie udává, že obsah rámce je platný. Tuto kategorii používá pouze port F, který obdrží celý rámec a dekóduje jej před jeho přesměrováním do jiného cílového umístění. Třetí kategorie udává, že obsah rámce je poškozený a rámec byl během přenosu zkrácen. Třetí kategorii využívají porty N i F k označení interní poruchy, například selhání vysílače, která neumožňuje normální přenos celého rámce. Tyto chyby jsou uvedeny v součtu chyb LLI.
enc out Ve slovech (nařízených sadách) mimo rámec FC došlo k 8bitovým/10bitovým chybám kódování. Pokud je toto kódování poškozeno nebo je zjištěna chyba „enc out“, dojde k zakódování slov mimo rámec.
Chyba kódování mimo rámce: Počet chyb kódování 8b/10b, ke kterým došlo mimo hranice rámce. Tento čítač se může během inicializace připojení změnit na nenulovou hodnotou. Pokud se však zvýší rychleji, než umožňuje bitová chybovost připojení (každých 20 minut pro 1 Gb/s), značí to problém. To je způsobeno poškozenými základními sekvencemi, to znamená: LIP f7,f7.
POZNÁMKA: Chyby „loss sig“, „loss sync“ a „enc out“ jsou očekávány vždy, když uživatel vypne nebo zapne port restartováním hostitele, vypnutím a zapnutím podsystému úložiště, odpojením nebo opětovným připojením kabelu nebo vyvoláním příkazu portDisable/portEnable. Důležitá je také skutečnost, že tyto chyby rovněž narůstají, zatímco 2Gbit přepínač vyjednává rychlost připojení k připojenému zařízení – pamatujte na to. Statisticky pouze chyby „enc out“ implikují problémy s kabely. Kombinace chyb „enc out“ a „crc err“ značí problémy s modulem SFP. Tyto chyby jsou uvedeny v součtu chyb LLI.
Disk c3 Počet zahozených rámců 3. třídy (Rx). Čítač obsahuje součet následujících čítačů pro zahození C3 nahlášené příkazem portstatshow:
er_rx_c3_timeout, er_tx_c2_timeout, er_c2_dest_unreach, and er_other_disc
Když zařízení odešle rámce bez použití funkce FLOGI nebo s neplatným cílem, může se vygenerovat chyba „Discard class 3“. Tato chyba hlásí, že došlo k takovému zahození.
Rámce 3. třídy lze zahodit z důvodu časových limitů nebo neplatných či nedostupných cílových umístění. Tento čítač se navyšuje během běžného provozu. Lze jej také použít k zobrazení zahlcení portu, což znamená, že nezávadné rámce z po sobě jdoucích identifikátorů S-ID a D-ID nejsou směrovány přímo na port, ale místo toho je rámec výjimky směrován prostřednictvím interního portu (to by obvykle nemělo probíhat u směrování portu na port na ASIC, ale děje se tak, když port D-ID vykazuje zaplnění vyrovnávací paměti a nemůže přijmout žádné další rámce). Pokud je také cíl zablokován kvůli vysokému zatížení ISL (tzn. dlouhá doba u čítače BB Credit Buffer = 0), může dojít k zaplnění vyrovnávací paměti, proto u portu S-ID může (v extrémních případech) dojít k vypršení časového limitu, a tak se navýší čítač „disc c3“. Tyto chyby jsou uvedeny v součtu chyb LLI.
Některé další informace: Port může přijímat v jednom okamžiku pouze jeden rámec (mimo připojení xWDM není možné poslat optickým kabelem 2 světelné impulsy najednou). Pokud se tedy 2 světelné zdroje pokusí sdílet port, musí použít arbitrážní algoritmus, kde projde jeden světelný zdroj a druhý čeká. Jakmile první zdroj projde, může projít i druhý zdroj. To znamená, že zdroje mohou běžet pouze při 50% využití (stejné časy zaneprázdnění a připravenosti). Pokud zdroj dokáže streamovat data rychlostí D-ID (což je v dnešní době případ velkého množství adaptérů HBA), jakýkoli pokus ze strany jiného, podobně rychlého adaptéru HBA povede ke snížení výkonu o 50 %.
Zaprotokolují se zahození „er_unreachable“, protože nebylo možné dosáhnout cílového umístění nebo proto, že v cílovém umístění jsou offline nebo online zařízení.
Události „er_other_disc“ představují skutečné zahození, které nespadají do jiné definované kategorie rámců zahození. Podle společnosti Brocade jsou nevýznamné a nemají žádný dopad na výkon.
Link fail Selhání připojení (stavy LF1 nebo LF2): Počet dosažení stavu Link fail1 nebo Link fail2 u daného portu. Přijato (Rx). Pokud port zůstává ve stavu LR Receive State po dobu delší, než je časový limit (R_T_TOV), bude zjištěna událost Link Reset Protocol Timeout, která způsobí selhání připojení (přejde do stavu NOS Transmit State).
Selhání připojení také znamená, že ztráta signálu nebo synchronizace trvá déle, než jak dlouho byla zjištěna hodnota R_T_TOV mimo režim offline.
Loss sync Ztráta synchronizace: Počet ztrát synchronizace. Selhání synchronizace na hranicích bitů nebo přenosových slov nejsou samostatně identifikovatelné a způsobují chyby ztráty synchronizace.
POZNÁMKA: Chyby „loss sig“, „loss sync“ a „enc out“ jsou očekávány vždy, když uživatel vypne nebo zapne port (restartováním hostitele, vypnutím a zapnutím podsystému úložiště, odpojením nebo opětovným připojením kabelu nebo vyvoláním příkazu portDisable nebo portEnable), loss isg = ztráta signálu: Počet ztrát signálu. Když přijímač v provozu rozpozná stav ztráty signálu, přejde do stavu Loss-Of-Synchronization (pokud v něm přijímač již není). Přijímač zůstane v tomto stavu, dokud se nevyskytne jedna z následujících podmínek: Stav ztráty signálu je opraven a synchronizace je obnovena nebo dojde k resetování přijímače.
Loss sig Počet přijetí ztráty signálu. Dochází k němu při přenosu signálu, ale na stejném portu není přijat žádný signál.
frjt Rámce zamítnuté s událostí F_RJT: Počet rámců Fabric Port Reject. To znamená, že je odepřeno doručení rámce. Mezi důvody zobrazení událost F_RJT patří: Třída není podporována, neplatná pole záhlaví, port N není k dispozici.
fbsy Pokud topologie Fabric nedodá v E_D_TOV rámec 2. třídy, rámec bude zahozen a zobrazí se událost F_BSY. (Tx) Rámce s událostí F_BSY: Fabric Port Busy Frame. Tento rámec vydává topologie Fabric a znamená to, že určitý rámec nelze dodat, protože topologie Fabric nebo cílový port N jsou zaneprázdněné.
c3-timeout tx Počet přenosových rámců 3. třídy zahozených na přenosovém portu z důvodu vypršení časového limitu (pro konkrétní platformu a port).
c3-timeout rx Počet přijatých rámců 3. třídy na tomto portu a zahozených na přenosovém portu z důvodu vypršení časového limitu (pro konkrétní platformu a port).
pcs err Počet chyb bloků Physical Coding Sublayer (PCS). Tento čítač zaznamenává porušení kódování na portech 10 Gb/s nebo 16 Gb/s.
V čítači porterrshow ER_PCS_BLK to platí pouze pro platformy, které podporují porty s rychlostí 10 Gb/s nebo 16 Gb/s (6505/6510/6520/DCX-8510), a prvně se to použilo u platformy Condor3 ASIC 5. generace. Tento čítač je ekvivalentní chybě enc_out pro připojení 8 GB nebo 4 GB a používá se pouze pro rychlost 10 GB a 16 GB.
10GB a 16GB připojení používají pro přenos dat kódování 64 B nebo 66 B namísto 8 B nebo 10 B a čítač „pcs err“ (=er_pcs_blk) zaznamenává porušení kódování na portech 10 Gb/s nebo 16 Gb/s zjištěných během dekódování.
uncor err Počet neopravitelných chyb Forward Error Corrections (FEC).
Additional Information
Podívejte se na toto video:
PŘÍKLADY nejběžnějších čítačů BROCADE.
Příklad 1: ENC OUT s chybou LINK FAIL a LOSS SYNC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Z chyb je patrné, že spojení selhalo, došlo ke ztrátě synchronizace a chybám „enc out“, které také mohou zahrnovat chybu „loss sig“.
Tyto kombinace chyb obecně označují restartování hostitele nebo resetování připojení externího přepínače. Chyby „enc out“ jsou způsobeny během rychlého vyjednávání v rámci inicializace připojení.
Očekávané akce: Ověřte, zda má zařízení připojené k portu legitimní důvod přejít do režimu offline/online, tj. restartovat hostitele. Pokud tomu tak není, vytvořte servisní požadavek.
Příklad 2: ENC OUT:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Chyby „enc out“ bez jakýchkoli souvisejících chyb poukazují na znečištěný kabel.
Očekávané akce: Zkontrolujte a očistěte všechny optické plochy na kabelu a SFP připojené k tomuto portu a připojeným zařízením.
Příklad 3: CRC a CRC G_EOF:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Rámec vstupuje do portu přepínače s chybou CRC, ale konec rámce je stále označený jako bezchybný.
To znamená, že se jedná o první port, který registruje vadný rámec, a problém se tedy týká modulu SFP / kabelu / připojeného zařízení na tomto konkrétním portu.
Očekávané akce: Viz výchozí akce v řešení.
U portu ISL vymažte statistiky pomocí příkazů statsclear a slotstatsclear, počkejte 4–6 hodin, shromážděte soubory supportsave z obou přepínačů a otevřete servisní požadavek pro normální odstraňování problémů.
Příklad 4 CRC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Port nahrává rámec vstupující do přepínače s chybným rámcem CRC, který je však již označen jako chybný. Obvykle je to vidět na F portech ISL a NPIV.
Očekávané akce: Pokud se chyby CRC objevují na portu NPIV, požádejte, aby zařízení prošetřil dodavatel služeb údržby!
U portu ISL zkontrolujte, zda některý z portů v topologii Fabric neuvádí chybu crc g_oef a proveďte akci, jak je uvedeno v příkladu 3.
Příklad 5: PCS ERR s chybou LINK FAIL a LOSS SYNC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
To platí pouze pro platformy, které podporují porty s rychlostí 10 Gb/s nebo 16 Gb/s (6505/6510/6520/DCX-8510) a byly představeny s platformou Condor3 ASIC 5. generace. ER_PCS_BLK uvádí počet bloků chyb PCS (Physical Coding Sublayer). Tento čítač je ekvivalentní chybě enc_out pro připojení 8 GB nebo 4 GB a používá se pouze pro rychlost 10 GB a 16 GB.
Z chyb je patrné selhání připojení, ztráta synchronizace a chyby „pcs err“, které také mohou zahrnovat chybu „loss sig“.
Tyto kombinace chyb obecně označují restartování hostitele nebo resetování připojení externího přepínače.
Chyby „pcs“ jsou způsobeny během rychlého vyjednávání v rámci inicializace připojení.
Očekávané akce: Ověřte, zda má zařízení připojené k portu legitimní důvod přejít do režimu offline/online, tj. restartovat hostitele. Pokud tomu tak není, vytvořte servisní požadavek.
Příklad 6: PCS ERR:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Chyby PCS ERR bez jakýchkoli souvisejících chyb poukazují na znečištěný kabel.
Očekávané akce: Zkontrolujte a očistěte všechny optické plochy na kabelu a SFP připojené k tomuto portu a připojeným zařízením.
Příklad 7: C3timout PLUS Disc c3:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 2.4k 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Chyba C3TIMEOUT zmizí s tím, že rámce budou u tohoto portu zahozeny po uplynutí výchozího časového limitu 500 ms.
TX – Rámce nelze odeslat z tohoto portu přepínače.
RX – Port přepínače nepřijme rámce a ty budou po uplynutí výchozího časového limitu 500 ms zahozeny.
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 0 0 0
Obecná příčina: Platí pouze v případě, že během posledních 24 hodin došlo k vymazání statistik portu. Tyto čítače jinak klasifikujte jako historické. Vymažte statistiku portu (https://support.emc.com/kb/304525) a po 4–6 hodinách znovu zachyťte data.
Hromadění rámců „unreachable“, „other“ nebo „unroutable“, které jsou zahozeny. (Podrobnosti o zahození najdete ve výstupu příkazu portstatsshow.)
Očekávané akce: Samostatné zahození C3, obecně bez dopadu na sítě SAN.
Příklad 9: Uncorr err:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
xx: 1.1g 468.4m 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 48
Počet bloků, které zůstaly neopravené samoopravným kódem FEC.
V případě jakýchkoli chyb CRC, enc_out, bad eof (pcs err), které by mohly ovlivnit datové rámce a nařízené sady (mohlo by dojít ke ztrátě r_rdy a vyčerpání kreditu), postupujte podle pokynů pro tyto chyby.
Pokud se počet těchto chyb nezvyšuje, neopravené chyby mají minimální efekt, značí však, že připojení obsahuje chyby, takže může jít o problém s kabelem nebo modulem SFP.
Pokud se zobrazí pouze chyba „uncorr“, je třeba nejprve otestovat kabel a očistit konektory.