Descarga de firmware entre FOS v8.1.x y FOS v8.2.x
Impacto:
- Recuperación en frío del switch de director
- El usuario realiza la operación lscfg, que falla con el evento raslog PMGR-1006
Entorno:
Hardware de Dell EMC: Connectrix ED-DCX6-4B
Hardware de Dell EMC: Connectrix ED-DCX6-8B
Software de Dell EMC: Connectrix B-Series Fabric OS (FOS) 8.1
Software de Dell EMC: Problema de Connectrix B-Series Fabric OS (FOS) 8.2:
La actualización de FOS 8.1.x a FOS 8.2.x puede crear un conjunto no válido de rangos de puertos en la entrada PORTMAP del archivo de configuración de fabric virtual (VF).
Esto solo puede ocurrir en los switches directores X6-8 o X6-4 después de actualizar a FOS 8.2.0 o versiones posteriores desde una versión anterior de FOS, y la entrada PORTMAP aumenta de tamaño >= 1024.
El tamaño de entrada de PORTMAP solo puede crecer más allá de los 1024 caracteres después de utilizar el comando "
lscfg" de la CLI que mueve repetidamente los puertos entre los switches lógicos. El tamaño de entrada actual de PORTMAP se calcula de la siguiente manera:
- Mediante el comando configupload -vfde la CLI, busque el archivo de configuración cargado y, a continuación, grep PORTMAP <uploaded-configuration-filename>" y cuente los caracteres que comienzan de "F" o "G" al carácter final "]".
Los switches directores X6-8 o X6-4 enviados de fábrica con FOS 8.2.0 o posterior ya instalados no estarán expuestos a este problema, a menos que se hayan degradado a una versión de FOS anterior a 8.2.0 y luego se actualicen nuevamente a FOS 8.2.0 o posterior.
Síntoma:
Switches no habilitados para VF:
- Los usuarios que NO tienen VF habilitada no verán ningún síntoma externo.
- Un examen de la entrada portmap en la configuración de VF puede mostrar números de puerto no válidos en el mapa de tablas, pero sin VF habilitada, estas entradas de número de puerto no válidas no afectarán la operación del switch.
- Los números de puerto entre 1800 y 3399 se consideran "entradas no válidas".
- Estos no afectarán a un sistema sin VF. Sin embargo, si hay fabrics lógicos en uso o hay planes para habilitar fabrics lógicos en un futuro, estas entradas no válidas se deben eliminar.
Cualquier límite de caracteres superior o que se acerque a 1024 se debe reducir para resolver o evitar los síntomas mencionados anteriormente después de alcanzar el límite de caracteres.
Switches habilitados para VF:
Los usuarios que tengan vf habilitado solo verán un impacto si el tamaño de la entrada PORTMAP en el archivo de configuración de VF crece por encima de las 1024 entradas.
Esto puede suceder si ocurre el movimiento repetido de puertos de un switch lógico a otro. El administrador verifica el tamaño de la tabla para determinar si se está acercando al punto de falla.
Compruebe portmap:
- Como usuario administrador, ejecute el comando configupload -vf. La salida se puede utilizar para ver las entradas de PORTMAP en el archivo de configuración de VF.
Muestra el FC y los PORTMAP ge, y muestra PORTMAP para todos los switches lógicos.
- Para comprobar manualmente el límite de 1024, cuente caracteres desde "F" o "G" hasta el "]" final o comuníquese con el soporte.
Ejemplo:
El PORTMAP de FC del archivo de ejemplo que se carga a continuación tiene 528 caracteres.
El GE PORTMAP del archivo de ejemplo que se carga a continuación tiene 510 caracteres.
Síntomas antes de alcanzar el límite de caracteres:
Ejemplo de archivo cargado:
# BROCADE
# VERSIÓN 822
# PLATAFORMA 166
# SWITCHCONF SYSTEM MAX ATTRIBUTE
SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED:0
ATTRIBUTE BLADE_IDS1:00afbab20000
ATTRIBUTE BLADE_IDS2:b1b1000000000
ATRIBUTO DEL SWITCH fcsw-0
FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS:1 TID:775683370
PIN 5
PORTMAP FC:[ 0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295 3320-3327,3352-3359,3384-3391]
PORTMAP GE:[ 0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359 3384 a 3391]
El PORTMAP también se puede encontrar en el archivo
de supportsave de RAS. (No RAS_POST; SOLO RAS).
Puede aparecer varias veces porque
el supportsave hace un "cat" de los archivos
vf-conf.<swbd>,switch-conf.<swbd>y
.save. El "cat" de
vf-conf.<swbd> es el mejor archivo que se puede usar.
Ejemplo del archivo supportsave switch0-xxx.xxx.xx.xxx-S1cp-202001152137.RAS.txt:
SWITCHCMD /bin/cat /etc/fabos/config/vf-conf.166:
&........................................................................................................****..............................................................................|
/bin/cat /etc/fabos/config/vf-conf.166:
SYSTEM max ATTRIBUTE
SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED::0
ATRIBUTO BLADE_IDS1:00afaf00000000
ATRIBUTO BLADE_IDS2:b1b10000000000
SWITCH fcsw-0
ATRIBUTO FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS :1 TID:901059396
PIN 5
PORTMAP FC:[ 0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295 3320-3327,3352-3359,3384-3391]
PORTMAP GE:[ 0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359 3384 a 3391]
Síntomas después de alcanzar el límite de caracteres:
síntomas de pdmd y hasmd panic:
El CP2 en espera toma el control iniciando un reinicio en CP1 debido a un estado de alarma
de pdmd.
A continuación, se activa una alarma de
hasmd en CP2, lo que da como resultado un reinicio doble del procesador en el switch y una recuperación en frío posterior.
- Pdm de alarma de CP1 activo
[KSWD-1002], 204763/5877, ranura 1 | | FFDC CHASIS, ADVERTENCIA, , Se detectó la finalización del proceso pdmd:2942
[SKU-1014], 204765/5878, RANURA 1 | CHASIS, CRÍTICO, Componente no reiniciable (pdm [pid=2942]) fallido
- Cp2 en espera toma el control, pero CP2 en espera también entra en estado de alarma con hasmd
[BITS-1004], 152469/1316, ranura 2 | CHASIS, INFO, BPGLCG01SL35V, Procesador reiniciado: Restablecimiento, reinicio.c
- Active CP se activa para restablecer el modo de espera y la recuperación en frío.
[EM-5012], 204809/0, ranura 1 | CHASIS, INFORMACIÓN, BPGLCG01SL35V, iniciar emd FSS_RECOV_COLD
[GP-1004], 5879, RANURA 1 | CHASIS, INFORMACIÓN, BPGLCG01SL35V, Procesador reiniciado: Restablecimiento.
[CABLE-1004], 5942, ranura 2 | CHASIS, INFORMACIÓN, BPGLCG01SL35V, Procesador reiniciado: Restablecimiento.
- El switch puede tener puertos que se deshabilitan de manera persistente con el estado Area has been acquired:
BASE:FID128:admin> switchshow | grep Area
256 1 32 338840 N16 No_Sync disabled (Persistent) (Persistent) (Area has been acquired)
258 1 34 338a40 N16 No_Sync Disabled (Persistent) (Persistent) (Area has been acquired) 264 1 40 338040 N16 No_Sync Disabled (Persistent) (Area has been acquired) (Area area has been acquired) (Area area has been acquired) (Area Area
256 1 338840 N16 N16 No_Sync Disabled (Persistent) (Area has been acquired) (Area Area 256 1 3388840 N16 N16 No_Sync Disabled (Persistent) (Área deshabilitada [persistente]) se adquirió)
266 1 42 338240 N16 No_Sync deshabilitado (persistente) (se adquirió área)
268 1 44 338440 N16 No_Sync deshabilitado (persistente) (se adquirió área)
270 1 46 338640 N16 No_Sync deshabilitado ( Persistente) (se adquirió el área)
272 2 32 339840 N16 No_Sync deshabilitada (persistente) (se adquirió el área)
[truncada]
- lscfg show output podría mostrar que TODOS los puertos están con el estado -1:
SW0:FID128:admin> lscfg --show
Switches creados FID (ID de dominio): 128(ds) (51) 127(51) 100(51) 77(51)
Ranura 1 2 3 4 5 6 7 8 9 10 11 12
------------------------------------------------------------------------------- Puerto
0 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
1 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
2 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
3 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
4 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
5 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
6 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
7 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
8 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
9 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
10 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
11 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
12 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
13 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
14 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
15 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
16 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
17 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
18 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
19 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
20 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
21 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
22 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
23 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
24 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
25 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
26 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
27 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
28 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
29 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
30 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
31 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
32 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
33 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
34 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
35 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
36 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
37 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
38 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
- Un HAfailover falla con el siguiente error cuando la salida lscfg --show se encuentra en este estado:
>>> hafailover
no se puede realizar una conmutación por error porque el sistema aún no está listo u otra configuración de LS/HA está en curso.
Hashow >>>
CP local (ranura 6, CP0): CP remoto activo y recuperado en frío
(ranura 7, CP1): En espera, HA con errores
habilitada, Latido hacia arriba, Estado de HA sincronizado
FOS 8.2.x tiene un tamaño de búfer PORTMAP más grande para permitir la compatibilidad con puertos FCOE. Los datos que se sincronizan desde FOS 8.1.x durante alta disponibilidad son de menor tamaño y pueden provocar que se observen datos dañados en los rangos de puertos más altos.