Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Connectrix: Cómo solucionar problemas del nodo Fibre Channel para cambiar el puerto o problemas de comunicación SFP mediante la eliminación, autoayuda.

Summary: En este artículo, se explica cómo solucionar problemas de comunicación del nodo fibre channel al puerto del switch o SFP mediante la eliminación.

This article applies to   This article does not apply to 

Symptoms

¿Cómo solucionar problemas del nodo Fibre Channel para cambiar el puerto o problemas de comunicación SFP mediante la eliminación?

Demasiados reemplazos proactivos de SFP Falla
de
enlace G Puerto
Sin luz No hay secuencia
operativa (NOS)
Secuencia de línea de apagado (OLS)
Pérdida de señal
fallido SFP
Solución de problemas de errores de puerto
FC en el puerto FC

Cause

Se reemplazaron demasiados SFP proactivamente mientras el problema se encuentra fuera del SFP o switch.

Resolution

Para resolver este problema:

  1. Identifique el nodo y el puerto del switch involucrados en la falla de las comunicaciones.
  2. Verifique que el puerto del switch esté activo administrativamente (desbloqueado, sin apagado) o habilitado.
  3. Asegúrese de que haya rutas redundantes disponibles para el dispositivo conectado antes de continuar.

 

PRECAUCIÓN: Antes de continuar, asegúrese de saber cómo reacciona el nodo si obtiene un FCID nuevo. Algunas versiones de sistemas operativos de AIX y HP-UX no reaccionan bien a estos cambios, ya que el FCID está incorporado en la ruta de hardware al dispositivo de almacenamiento. Si mueve el cable, es posible que no haya datos disponibles. Si tiene alguna duda, consulte con un ingeniero de soporte técnico de EMC.

 

  1. Para eliminar el SFP de ser el problema, realice lo siguiente:

 

NOTA:  Si hay un problema con el SFP, este procedimiento es la manera más rápida de volver a poner el dispositivo en línea.

 

  1. Compruebe el puerto libre en el switch.
  2. Deshabilite el puerto libre identificado en el switch.
  3. Mueva el cable del puerto que se investigará al nuevo puerto libre deshabilitado en el paso anterior.
  1. Cambie el puerto deshabilitado para habilitar el estado (o administrativamente activo) y vuelva a poner el dispositivo en línea.
  2. Borre/restablezca las estadísticas/contadores a cero en el switch. (Consulte las notas Cómo...)
  3. Monitoree el puerto con los comandos correspondientes durante 4 a 6 horas.
  • Si los contadores de errores aumentan, el problema se encuentra fuera del switch y se debe recomendar al cliente que:
    • El nuevo puerto SFP y el cable requieren limpieza. (Para evitar la contaminación en el SFP de un cable sucio. Considere el uso del kit de limpieza de EMC).
    • Cualquier persona que admita el dispositivo debe investigar más a fondo el dispositivo conectado.
    • En el switch Cisco, si el estado "errdisabled" vuelve sin aumento de contador, se debe abrir una SR para una investigación adicional de back-end.
  • Si los errores no aumentan (o el estado Errdisabled en el switch Cisco no vuelve), el SFP en el puerto anterior está defectuoso, emita una SOLICITUD de servicio para el reemplazo de SFP y proporcione los resultados del análisis anterior, los detalles de SFP (SM o MM, y la velocidad, etc.)

 

NOTA: Puede realizar el mismo procedimiento desde el paso 6 en adelante si reemplazó el cable o el dispositivo conectado comprobando los contadores.

 

Additional Information

NOTA: La mayoría de las veces, si un transceptor óptico SFP falla definitivamente, verá una falla óptica clara en el registro de eventos.

Las fallas de hardware se pueden aislar fácilmente mediante la aplicación de un algoritmo simple al problema; si no es esta pieza de hardware, entonces es la otra pieza. Haga un bucle hasta que aísle la falla.


EJEMPLOS DE BROCADE:
NOTA: Para obtener una explicación o una descripción de los contadores, consulte el artículo de la base de conocimientos:
Connectrix serie B: Cómo interpretar la salida de brocade porterrshow y qué significan los contadores.


Ejemplo 1 ENC OUT con ERROR DE VÍNCULO y SINCRONIZACIÓN DE PÉRDIDA:

 

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     4     6     0     0     0     0      0     0


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

A partir de los errores, podemos ver que el vínculo falla y la pérdida de errores de sincronización PLUS enc out, estos también pueden incluir el error de pérdida sig.
Por lo general, estas combinaciones de errores indican un reinicio del host o un restablecimiento de enlace externo al switch. Los errores de enc out se producen durante la negociación de velocidad como parte de una inicialización de enlace.

Acciones esperadas:
verifique que el dispositivo conectado al puerto tenga un motivo legítimo para quedar offline o en línea. Por ejemplo, reinicio del host. Si no es así, genere una SR.


Ejemplo 2 ENC OUT:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    2.3m  0     0     0     0     0     0     0      0     0


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

Los errores de enc out sin errores asociados indican un cable sucio.

Acciones esperadas:
inspeccione y limpie todas las caras ópticas en el cable y el SFP conectados a este puerto y a los dispositivos conectados.


Ejemplo 3 G_EOF CRC y CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 1.2k   0     0     0    0     0     0     0     0     0     0     0      0     0


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

La trama está ingresando al puerto del switch con un CRC defectuoso, pero con el extremo de la trama aún marcado como bueno.
Esto indica que este es el primer puerto que registra la trama defectuosa, por lo que el problema es la interfaz de SFP/cable/dispositivo conectado en este puerto específico.

Acciones esperadas:
consulte la acción predeterminada en la resolución.

Para un puerto ISL, borre las estadísticas constatsclear y slotstatsclear commands, espere de 4 a 6 horas y recopile los supportsaves de ambos switches y abra la SR para la solución de problemas normal.

Ejemplo 4 CRC:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    1.2k 0      0     0     0    0     0     0     0     0     0     0     0      0     0


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

El puerto está registrando una trama que ingresa al switch con una trama CRC defectuosa, pero con la trama ya marcada como defectuosa. Normalmente, vea esto en los puertos F de ISL y NPIV.

Acciones esperadas:
si los errores CRC están iniciando sesión en el puerto NPIV, haga que el proveedor investigue el dispositivo.
En el caso de un puerto ISL, compruebe todos los puertos de fabric en busca de cualquier g_oef crc de registro de puertos y realice una acción como en el ejemplo 3.


Ejemplo 5 DE ERR de PCS con ERROR DE VÍNCULO y SINCRONIZACIÓN DE PÉRDIDA:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     4     4     0     0     0     0      0     466


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

Esto se aplica solo a plataformas que admiten puertos de 10 Gbps o 16 Gbps (6505/6510/6520/DCX-8510) y se introdujo con Condor3 ASIC, la plataforma GEN5. ER_PCS_BLK muestra la cantidad de errores de bloque de la subcapa de codificación física (PCS). Este contador es equivalente a enc_out para el enlace de 8 Gb/4 Gb y se utiliza solo para velocidad de 10 GB y 16 GB.
A partir de los errores, podemos ver la falla del enlace y la pérdida de sincronización más errores de err de PCs, estos también pueden incluir el error de sig de pérdida.
Por lo general, estas combinaciones de errores indican un reinicio del host o un restablecimiento de enlace externo al switch.
Los errores de err de pcs se producen durante la negociación de velocidad como parte de la inicialización del enlace.

Acciones esperadas:
verifique que el dispositivo conectado al puerto tenga un motivo legítimo para quedar offline o en línea. Por ejemplo, reinicio del host. Si no es así, eleve la SR.


Ejemplo 6 DE ERR de PCS:

porterrshow        :
CURRENT CONTEXT -- 3 , 111
     frames        enc  crc  crc    too   too   bad  enc   disc  link  loss  loss  frjt  fbsy  c3timeout    pcs
     tx     rx     in   err  g_eof  shrt  long  eof  out   c3    fail  sync  sig               tx    rx     err
xx:  849.1k 493.2k 0    0    0      0     0     0    0     0     0     0     0     0     0     0      0     466


Motivo general:
solo es válido si las estadísticas de puertos se borraron en las últimas 24 horas. De lo contrario, clasifique estos contadores como históricos. Borre las estadísticas de puertos (https://support.emc.com/kb/304525) y vuelva a tomar los datos después de 4 a 6 horas.

Los errores DE ERR de PCS sin errores asociados indican un cable sucio.

Acciones esperadas:
inspeccione y limpie todas las caras ópticas en el cable y el SFP conectados a este puerto y a los dispositivos conectados.

EJEMPLOS DE CISCO:

Ejemplo 1:

Errdisabled: no se incrementan los errores de interfaz
 

fc1/1 is down (Error disabled - bit error rate too high)
    Hardware is Fibre Channel, SFP is short wave laser w/o OFC (SN).
    5 minutes input rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
    5 minutes output rate 0 bits/sec, 0 bytes/sec, 0 frames/sec
      179 frames input, 7668 bytes
        0 discards, 0 errors
        0 CRC,  0 unknown class
        0 too long, 0 too short
      23 frames output, 1320 bytes
        0 discards, 0 errors
      1 input OLS, 1 LRR, 0 NOS, 1 loop inits
      2 output OLS, 0 LRR, 0 NOS, 1 loop inits
    Interface last changed at Thu Jun  5 01:51:00 2014


Motivo general:

El estado "Errdisabled" de una interfaz puede ser un poco confuso, ya que los contadores de interfaz pueden estar limpios en el front-end y el switch parece bajar el puerto con un estado "errdisabled" y los contadores de errores aumentan en el back-end (ASIC/internal/linecard).

Acciones esperadas:

Consulte la acción predeterminada en la resolución. Si vuelve a ocurrir, recopile la salida de los detalles de soporte técnico y abra la SR.
 

NOTA: Información sobre el estado "Errdisabled" de Cisco: Los errores de bits pueden ocurrir por las siguientes razones:
  • Cable defectuoso o defectuoso
  • SFP defectuoso o defectuoso
  • Se especifica que SFP funcione a 1 Gbps, pero se utiliza a 2 Gbps.
  • Se especifica que SFP funcione a 2 Gbps, pero se utiliza a 4 Gbps.
  • El cable de corto plazo se utiliza para larga distancia o el cable de larga distancia se utiliza para corto plazo.
  • Pérdida de sincronización momentánea
  • Conexión de cables suelta en uno o ambos extremos
  • Conexión SFP inadecuada en uno o ambos extremos
Se detecta un umbral de tasa de errores de bits cuando se producen 15 ráfagas de error en un período de 5 minutos. De manera predeterminada, el switch deshabilita la interfaz cuando se alcanza el umbral. Puede ingresar una secuencia de comandos de apagado y sin apagado para volver a activar la interfaz.

Puede configurar el switch para que no deshabilite una interfaz cuando se supere el umbral. De manera predeterminada, el umbral deshabilita la interfaz.


Ejemplo 2:

CRC en incrementos
 

fc13/1 is down (Initializing)
    Port description is ***
    Hardware is Fibre Channel, SFP is long wave laser cost reduced
.
    5 minutes input rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
    5 minutes output rate 32 bits/sec, 4 bytes/sec, 0 frames/sec
      162 frames input, 6136 bytes
        0 discards, 17 errors
        17 CRC,  0 unknown class
        0 too long, 17 too short
      74 frames output, 6304 bytes
        2 discards, 0 errors
      108 input OLS, 54 LRR, 2 NOS, 0 loop inits
      83 output OLS, 26 LRR, 56 NOS, 0 loop inits
    Interface last changed at Tue May 27 08:37:20 2014


Motivo general:

el puerto está registrando una trama que ingresa al switch con un CRC defectuoso, pero un buen extremo de la trama. El contador de CRC solo aumenta en el puerto de ingreso específico que registra el error y cualquier investigación se debe realizar en este enlace físico.

Acciones esperadas:

consulte la acción predeterminada en la resolución.

Borrado de estadísticas en switches Cisco:

utilice los comandos:

  • Para borrar los contadores de interfaz:
MDS-9509# clear counters interface all

 

  • Para borrar contadores de interfaz si los canales de puerto están configurados:
MDS-9509# clear counters interface port-channel 

 

  •  Para borrar los contadores ASIC, es necesario "conectar" a todas las tarjetas de línea. Ejemplo:
MDS-9509# attach module 1
Attaching to module 1 ...
To exit type 'exit', to abort type '$.'
Bad terminal type: "ansi". Will assume vt100.
module-1# clear asic-cnt all

 

Affected Products

Connectrix

Products

Connectrix, Connectrix B-Series Hardware, Connectrix MDS-Series Hardware