Sådan foretager du fejlfinding af Fibre Channel-node for at skifte port eller SFP-kommunikationsproblemer ved eliminering?
For mange pro-aktive SFP-udskiftninger
Linkfejl
G-port
Ingen lys
ikke driftssekvens (NOS)
Off Line Sequence (OLS)
Tab af signalfejl
I SFP
fejlfinding i FC-portfejl
på FC-port
For mange SFP udskiftes proaktivt, mens problemet ligger uden for SFP'en eller switchen.
Sådan løses problemet:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
Ud fra fejlene kan vi opleve linkfejl og tab af sync PLUS enc out-fejl. Disse kan også omfatte tab sig-fejl.
Disse fejlkombinationer indikerer normalt en genstart af værten eller en ekstern forbindelsesnulstilling for switchen. Enc out-fejlene er forårsaget under hastigheds forhandling som en del af en linkinitialisering.
Forventede handlinger:
Kontroller, at den enhed, der er tilsluttet porten, havde en berettiget grund til at gå offline og/eller online. F.eks. genstart af vært. Hvis ikke, skal du hæve en SR.
Eksempel 2 ENC OUT:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
Enc out-fejl uden tilknyttede fejl indikerer snavset kabel.
Forventede handlinger:
Undersøg og rengør alle optikflader på kabel og SFP, der er tilsluttet denne port og tilsluttede enheder.
Eksempel 3 CRC- og CRC-G_EOF:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
Rammen går ind i switch-porten med en dårlig CRC, men når rammens ende stadig er markeret som god.
Dette er en indikation af, at dette er den første port til at registrere den defekte ramme, så problemet er enten SFP/kabel/tilsluttet enhedsgrænseflade på denne specifikke port.
Forventede handlinger:
Se standardhandlingen i løsningen.
For en ISL-port skal du rydde statistik medstatistik og slotstatsclear commands, vente 4-6 timer og indsamle supportaves fra begge switche og åbne SR til normal fejlfinding.
Eksempel 4 CRC:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
Porten registrerer en ramme, der kommer ind i switchen med en dårlig CRC-ramme, men med rammen allerede markeret som dårlig. Normalt kan du se dette på en ISL- og NPIV F-port.
Forventede handlinger:
Hvis CRC-fejl logger på NPIV-port, skal enheden undersøges af vedligeholdelse af leverandøren!
For en ISL-port skal du kontrollere alle porte i strukturen for enhver crc-g_oef til portlogføring og handling som i eksempel 3.
Eksempel på 5 PCS-FEJL med LINK MISLYKKET OG TAB-SYNKRONISERING:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
Dette er kun relevant på platforme, der understøtter 10 Gbps eller 16 Gbps porte (6505/6510/6520/DCX-8510), og det blev introduceret med Heror3 ASIC, GEN5-platformen. ER_PCS_BLK viser antallet af fysiske kodeunderlagsblokfejl (PCS). Denne tæller svarer til enc_out for 8 GB/4 GB link, og den bruges kun til hastighed på 10 GB og 16 GB.
Ud fra fejlene kan vi opleve linkfejl og tab af synkronisering samt pc'er-fejl. Disse kan også omfatte tab sig fejl.
Disse kombinationer af fejl angiver normalt en genstart af værten eller nulstilling af et link, der er eksternt for switchen.
Pc'ens fejl er forårsaget under hastigheds forhandling som en del af linkinitialisering.
Forventede handlinger:
Kontroller, at den enhed, der er tilsluttet porten, havde en berettiget grund til at gå offline og/eller online. F.eks. genstart af vært. Hvis ikke, skal du hæve SR.
Eksempel: 6 PCS-fejl:
porterrshow : CURRENT CONTEXT -- 3 , 111 frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.
PCS ERR-fejl uden tilknyttede fejl indikerer snavset kabel.
Forventede handlinger:
Undersøg og rengør alle optikflader på kabel og SFP, der er tilsluttet denne port og tilsluttede enheder.
EKSEMPLER PÅ CISCO:
Eksempel 1:
Errdisabled - ingen grænsefladefejl stigende
fc1/1 is down (Error disabled - bit error rate too high) Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN). 5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec 179 frames input, 7668 bytes 0 discards, 0 errors 0 CRC, 0 unknown class 0 too long, 0 too short 23 frames output, 1320 bytes 0 discards, 0 errors 1 input OLS, 1 LRR, 0 NOS, 1 loop inits 2 output OLS, 0 LRR, 0 NOS, 1 loop inits Interface last changed at Thu Jun 5 01:51:00 2014
Generel årsag:
Tilstanden "Errdisabled" i en grænseflade kan være en smule misvisende, da grænsefladetællere kan rengøres i frontend, og switchen ser ud til at være nede i porten med tilstanden "errdisabled" og fejltællere stigende i backend (ASIC/internt/linjekort).
Forventede handlinger:
Se standardhandlingen i løsningen. Hvis der opstår igen, skal du indsamle output fra teknisk support og åbne SR.
Eksempel 2:
CRC-trin
fc13/1 is down (Initializing) Port description is *** Hardware is Fibre Channel, SFP is long wave laser cost reduced . 5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec 5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec 162 frames input, 6136 bytes 0 discards, 17 errors 17 CRC, 0 unknown class 0 too long, 17 too short 74 frames output, 6304 bytes 2 discards, 0 errors 108 input OLS, 54 LRR, 2 NOS, 0 loop inits 83 output OLS, 26 LRR, 56 NOS, 0 loop inits Interface last changed at Tue May 27 08:37:20 2014
Generel årsag:
Porten registrerer en ramme, der går ind i switchen med en dårlig CRC, men en god ende af rammen. CRC-tælleren stiger kun på den specifikke indtrængningsport, der logger fejlen, og eventuelle undersøgelser bør foretages på dette fysiske link.
Forventede handlinger:
Se standardhandlingen i løsningen.
Rydning af statistik på Cisco-switche:
Brug kommandoerne:
MDS-9509# clear counters interface all
MDS-9509# clear counters interface port-channel
MDS-9509# attach module 1 Attaching to module 1 ... To exit type 'exit', to abort type '$.' Bad terminal type: "ansi". Will assume vt100. module-1# clear asic-cnt all