Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Connectrix: Sådan foretager du fejlfinding af Fibre Channel-node for at skifte port eller SFP-kommunikationsproblemer ved eliminering, selvhjælp.

Summary: Denne artikel forklarer, hvordan du foretager fejlfinding af Fibre Channel-node for at skifte port eller SFP-kommunikationsproblemer ved eliminering.

This article applies to   This article does not apply to 

Symptoms

Sådan foretager du fejlfinding af Fibre Channel-node for at skifte port eller SFP-kommunikationsproblemer ved eliminering?

For mange pro-aktive SFP-udskiftninger
Linkfejl
G-port
Ingen lys
ikke driftssekvens (NOS)
Off Line Sequence (OLS)
Tab af signalfejl
I SFP
fejlfinding i FC-portfejl
på FC-port

Cause

For mange SFP udskiftes proaktivt, mens problemet ligger uden for SFP'en eller switchen.

Resolution

Sådan løses problemet:

  1. Identificer den node og switch-port, der er involveret i kommunikationsfejlen.
  2. Kontroller, at switch-porten er administrativ aktiv (ikke-blokeret, ingen nedlukning) eller aktiveret.
  3. Sørg for, at der er redundante stier tilgængelige for den tilsluttede enhed, før du fortsætter.

 

ADVARSEL: Før du går videre, skal du sørge for at vide, hvordan din node reagerer, hvis den får et nyt FCID. Nogle operativsystemversioner af AIX og HP-UX reagerer ikke godt på sådanne ændringer, da FCID er indbygget i hardwarestien til lagringsenheden. Hvis du flytter kablet, har du muligvis ikke tilgængelige data. Hvis du er i tvivl, skal du kontakte en teknisk supporttekniker fra EMC.

 

  1. For at eliminere SFP for at være problemet skal du gøre følgende:

 

BEMÆRK:  Hvis der er et problem med SFP'en, er denne procedure den hurtigste måde at bringe enheden online igen.

 

  1. Se efter ledig port på switchen.
  2. Deaktiver den identificerede ledige port på switchen.
  3. Flyt kablet fra porten for at blive undersøgt til den nye deaktiverede ledige port i det forrige trin.
  1. Skift den deaktiverede port for at aktivere tilstanden (eller administrativ op), og sæt enheden online igen.
  2. Ryd/nulstil statistik/tællere til nul på switchen. (Se notater, hvordan du gør...)
  3. Overvåg porten med de respektive kommandoer i 4-6 timer.
  • Hvis fejltællerne øges, ligger problemet uden for switchen, og kunden skal rådes til at:
    • Den nye port-SFP og kablet skal rengøres. (For at undgå kontamination på SFP'en af et snavset kabel. Overvej at bruge EMC-rensesættet).
    • Den tilsluttede enhed skal undersøges yderligere af, hvem der understøtter enheden.
    • Hvis tilstanden "errdisabled" på Cisco-switch vender tilbage uden tællerstigning, skal der åbnes en SR for yderligere backend-undersøgelse.
  • Hvis fejlene ikke øges (eller errdisabled-tilstanden på Cisco-switchen ikke vender tilbage), er SFP'en på den forrige port defekt, hæve SR for SFP-udskiftning, hvilket giver ovenstående analyseresultater, SFP-oplysninger (SM eller MM og hastighed osv.)

 

BEMÆRK: Du kan gøre det samme fra trin 6 og frem, hvis du udskifter kablet og/eller den tilsluttede enhed, ved at kontrollere tællerne.

 

Additional Information

BEMÆRK: Hvis en optisk SFP-transceiver helt sikkert mislykkes for det meste, får du vist en tydelig optikfejl i hændelsesloggen.

Hardwarefejl kan nemt isoleres ved at anvende en enkel algoritme på problemet. Hvis det ikke er dette hardwareelement, er det den anden enhed. Sløjfe, indtil du isolerer fejlen.


BROCADE EKSEMPLER:
BEMÆRK: Du kan se en forklaring eller beskrivelse af tællerne i Vidensbaseartiklen:
Connectrix B-serien: Sådan fortolker du Brocade porterrshow output, og det betyder tællerne.


Eksempel 1 ENC OUT med LINK FAIL og SYNC FOR TAB:

 

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     4     6     0     0     0     0      0     0


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

Ud fra fejlene kan vi opleve linkfejl og tab af sync PLUS enc out-fejl. Disse kan også omfatte tab sig-fejl.
Disse fejlkombinationer indikerer normalt en genstart af værten eller en ekstern forbindelsesnulstilling for switchen. Enc out-fejlene er forårsaget under hastigheds forhandling som en del af en linkinitialisering.

Forventede handlinger:
Kontroller, at den enhed, der er tilsluttet porten, havde en berettiget grund til at gå offline og/eller online. F.eks. genstart af vært. Hvis ikke, skal du hæve en SR.


Eksempel 2 ENC OUT:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     0     0     0     0     0     0      0     0


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

Enc out-fejl uden tilknyttede fejl indikerer snavset kabel.

Forventede handlinger:
Undersøg og rengør alle optikflader på kabel og SFP, der er tilsluttet denne port og tilsluttede enheder.


Eksempel 3 CRC- og CRC-G_EOF:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 1.2k   0     0     0    0     0     0     0     0     0     0     0      0     0


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

Rammen går ind i switch-porten med en dårlig CRC, men når rammens ende stadig er markeret som god.
Dette er en indikation af, at dette er den første port til at registrere den defekte ramme, så problemet er enten SFP/kabel/tilsluttet enhedsgrænseflade på denne specifikke port.

Forventede handlinger:
Se standardhandlingen i løsningen.

For en ISL-port skal du rydde statistik medstatistik og slotstatsclear commands, vente 4-6 timer og indsamle supportaves fra begge switche og åbne SR til normal fejlfinding.

Eksempel 4 CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 0      0     0     0    0     0     0     0     0     0     0     0      0     0


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

Porten registrerer en ramme, der kommer ind i switchen med en dårlig CRC-ramme, men med rammen allerede markeret som dårlig. Normalt kan du se dette på en ISL- og NPIV F-port.

Forventede handlinger:
Hvis CRC-fejl logger på NPIV-port, skal enheden undersøges af vedligeholdelse af leverandøren!
For en ISL-port skal du kontrollere alle porte i strukturen for enhver crc-g_oef til portlogføring og handling som i eksempel 3.


Eksempel på 5 PCS-FEJL med LINK MISLYKKET OG TAB-SYNKRONISERING:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     4     4     0     0     0     0      0     466


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

Dette er kun relevant på platforme, der understøtter 10 Gbps eller 16 Gbps porte (6505/6510/6520/DCX-8510), og det blev introduceret med Heror3 ASIC, GEN5-platformen. ER_PCS_BLK viser antallet af fysiske kodeunderlagsblokfejl (PCS). Denne tæller svarer til enc_out for 8 GB/4 GB link, og den bruges kun til hastighed på 10 GB og 16 GB.
Ud fra fejlene kan vi opleve linkfejl og tab af synkronisering samt pc'er-fejl. Disse kan også omfatte tab sig fejl.
Disse kombinationer af fejl angiver normalt en genstart af værten eller nulstilling af et link, der er eksternt for switchen.
Pc'ens fejl er forårsaget under hastigheds forhandling som en del af linkinitialisering.

Forventede handlinger:
Kontroller, at den enhed, der er tilsluttet porten, havde en berettiget grund til at gå offline og/eller online. F.eks. genstart af vært. Hvis ikke, skal du hæve SR.


Eksempel: 6 PCS-fejl:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     0     0     0     0     0     0      0     466


Generel årsag:
Gælder kun, hvis portstatistik er blevet ryddet inden for de sidste 24 timer. Ellers klassificeres disse tællere som historiske. Ryd portstatistik (https://support.emc.com/kb/304525), og genindtag data efter 4-6 timer.

PCS ERR-fejl uden tilknyttede fejl indikerer snavset kabel.

Forventede handlinger:
Undersøg og rengør alle optikflader på kabel og SFP, der er tilsluttet denne port og tilsluttede enheder.

EKSEMPLER PÅ CISCO:

Eksempel 1:

Errdisabled - ingen grænsefladefejl stigende
 

fc1/1 is down (Error disabled - bit error rate too high)
    Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN).
    5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
    5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
      179 frames input, 7668 bytes
        0 discards, 0 errors
        0 CRC,  0 unknown class
        0 too long, 0 too short
      23 frames output, 1320 bytes
        0 discards, 0 errors
      1 input OLS, 1 LRR, 0 NOS, 1 loop inits
      2 output OLS, 0 LRR, 0 NOS, 1 loop inits
    Interface last changed at Thu Jun  5 01:51:00 2014


Generel årsag:

Tilstanden "Errdisabled" i en grænseflade kan være en smule misvisende, da grænsefladetællere kan rengøres i frontend, og switchen ser ud til at være nede i porten med tilstanden "errdisabled" og fejltællere stigende i backend (ASIC/internt/linjekort).

Forventede handlinger:

Se standardhandlingen i løsningen. Hvis der opstår igen, skal du indsamle output fra teknisk support og åbne SR.
 

BEMÆRK: Oplysninger om tilstanden "Errdisabled" fra Cisco: Bit-fejlene kan opstå af følgende årsager:
  • Defekt eller dårligt kabel
  • Defekt eller dårlig SFP
  • SFP er angivet til at fungere ved 1 Gbps, men bruges ved 2 Gbps.
  • SFP er angivet til at fungere ved 2 Gbps, men bruges ved 4 Gbps.
  • Kort kablet bruges til lang levetid, eller det lange levetidskabel bruges til korte levetider.
  • Midlertidig synkroniseringstab
  • Løs kabeltilslutning i den ene eller begge ender
  • Forkert SFP-forbindelse i den ene eller begge ender
En grænseværdi for bit-fejlfrekvens registreres, når der forekommer 15 fejl i en periode på 5 minutter. Som standard deaktiverer switchen grænsefladen, når grænsen er nået. Du kan indtaste en nedluknings- og ingen nedlukningskommandosekvens for at genaktivere grænsefladen.

Du kan konfigurere switchen til ikke at deaktivere en grænseflade, når grænsen er overskredet. Som standard deaktiverer grænseværdien grænsefladen.


Eksempel 2:

CRC-trin
 

fc13/1 is down (Initializing)
    Port description is ***
    Hardware is Fibre Channel, SFP is long wave laser cost reduced
.
    5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
    5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
      162 frames input, 6136 bytes
        0 discards, 17 errors
        17 CRC,  0 unknown class
        0 too long, 17 too short
      74 frames output, 6304 bytes
        2 discards, 0 errors
      108 input OLS, 54 LRR, 2 NOS, 0 loop inits
      83 output OLS, 26 LRR, 56 NOS, 0 loop inits
    Interface last changed at Tue May 27 08:37:20 2014


Generel årsag:

Porten registrerer en ramme, der går ind i switchen med en dårlig CRC, men en god ende af rammen. CRC-tælleren stiger kun på den specifikke indtrængningsport, der logger fejlen, og eventuelle undersøgelser bør foretages på dette fysiske link.

Forventede handlinger:

Se standardhandlingen i løsningen.

Rydning af statistik på Cisco-switche:

Brug kommandoerne:

  • Sådan ryddes grænsefladetællere:
MDS-9509# clear counters interface all

 

  • Sådan ryddes grænsefladetællere, hvis portkanalerne er konfigureret:
MDS-9509# clear counters interface port-channel 

 

  •  For at rydde ASIC-tællere er det nødvendigt at "fastgøre" til alle linjekort. Eksempel:
MDS-9509# attach module 1
Attaching to module 1 ...
To exit type 'exit', to abort type '$.'
Bad terminal type: "ansi". Will assume vt100.
module-1# clear asic-cnt all

 

Affected Products

Connectrix

Products

Connectrix, Connectrix B-Series Hardware, Connectrix MDS-Series Hardware
Article Properties
Article Number: 000028863
Article Type: Solution
Last Modified: 02 Oct 2023
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.