FOS v8.1.x 및 FOS v8.2.x 간의 펌웨어 다운로드
영향:
- 디렉터 스위치 콜드 복구
- 사용자가 lscfg 작업을 수행하는 데 PMGR-1006 raslog 이벤트로 실패
환경:
Dell EMC Hardware: Connectrix ED-DCX6-4B
Dell EMC Hardware: Connectrix ED-DCX6-8B
Dell EMC Software: Connectrix B-Series Fabric OS(FOS) 8.1
Dell EMC Software: Connectrix B-Series Fabric OS(FOS) 8.2
문제:
FOS 8.1.x에서 FOS 8.2.x(으)로 업그레이드하면 VF(Virtual Fabric) 구성 파일의 PORTMAP 항목에 잘못된 포트 범위 집합이 생성될 수 있습니다.
이전 FOS 버전에서 FOS 8.2.0 이상으로 업그레이드한 후 X6-8 또는 X6-4 디렉터 스위치에서만 이 문제가 발생할 수 있으며 PORTMAP 항목 크기가 1024 이상으로 증가합니다.
PORTMAP 항목 크기는 "lscfg" CLI 명령을 사용하여 논리적 스위치 간에 포트를 반복적으로 이동한 후에만 1024자를 초과할 수 있습니다. 현재 PORTMAP 항목 크기는 다음과 같이 계산할 수 있습니다.
- CLI 명령 "configupload-vf"를 사용하여 업로드된 구성 파일을 찾은 다음 grep PORTMAP <uploaded-configuration-filename>"을 실행하여 "F" 또는 "G"로 시작해 "]" 문자로 끝나는 문자들의 개수를 셉니다.
FOS 8.2.0 이상이 이미 설치된 공장에서 출고된 X6-8 또는 X6-4 디렉터 스위치는 8.2.0 이전의 FOS 버전으로 다운그레이드했다가 다시 FOS 8.2.0 이상으로 업그레이드하지 않는 한 이 문제에 노출되지 않습니다.
증상:
VF 비활성화 스위치:
- VF를 활성화하지 않은 사용자는 외부 증상을 볼 수 없습니다.
- VF 구성에서 PORTMAP 항목을 검사하면 테이블 맵에 잘못된 포트 번호가 표시될 수 있지만 VF가 활성화되지 않은 경우 이러한 잘못된 포트 번호 항목은 스위치 작동에 영향을 주지 않습니다.
- 1800에서 3399 사이의 모든 포트 번호는 "잘못된 항목"으로 간주됩니다.
- VF가 없는 시스템에는 영향을 미치지 않습니다. 그러나 논리적 패브릭이 사용 중이거나 나중에 논리적 패브릭을 사용할 계획이 있는 경우 이러한 잘못된 항목을 제거해야 합니다.
문자 수 제한에 도달한 후 위에서 언급된 증상을 해결/방지하려면 문자 수 제한이 1024보다 높거나 가까운 경우 이를 줄여야 합니다.
VF 활성화 스위치:
VF를 활성화한 사용자는 VF 구성 파일의 PORTMAP 항목 크기가 1024개 항목 이상으로 증가하는 경우에만 영향을 볼 수 있습니다.
이 문제는 한 논리적 스위치에서 다른 논리적 스위치로 포트가 반복적으로 이동하는 경우에 발생할 수 있습니다. 관리자가 테이블 크기를 확인하여 장애 지점에 근접하고 있는지 확인할 수 있습니다.
PORTMAP 확인:
- 관리자 권한으로 'configupload -vf' 명령을 실행합니다. 출력을 사용하여 VF 구성 파일에서 PORTMAP 항목을 볼 수 있습니다.
FC와 GE PORTMAP을 모두 보여 주며 모든 논리적 스위치의 PORTMAP을 보여 줍니다.
- 1024 제한을 수동으로 확인하려면 "F" 또는 "G"부터 마지막 "]"까지 문자를 세거나 지원 센터에 문의합니다.
예:
아래에 업로드된 예제 파일의 FC PORTMAP에는 528자가 있습니다.
아래에 업로드된 예제 파일의 GE PORTMAP에는 510자가 있습니다.
문자 수 제한에 도달하기 전의 증상:
업로드된 파일의 예:
# BROCADE
# VERSION 822
# PLATFORM 166
# SWITCHCONF
SYSTEM max
ATTRIBUTE SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED:0
ATTRIBUTE BLADE_IDS1:00afafbab20000
ATTRIBUTE BLADE_IDS2:b1b10000000000
SWITCH fcsw-0
ATTRIBUTE FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS:1 TID:775683370
PIN 5
PORTMAP FC:[0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP GE:[0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP은 RAS supportsave 파일에서도 찾을 수 있습니다. (RAS_POST가 아닌 RAS만 해당)
supportsave가 vf-conf.<swbd>, switch-conf.<swbd> 및 .save 파일의 'cat'을 수행하기 때문에 이는 여러 번 나타날 수 있습니다. vf-conf.<swbd>의 'cat'이 가장 좋은 사용 방법입니다.
supportsave 파일 switch0-xxx.xxx.xx.xxx-S1cp-202001152137.RAS.txt의 예:
********************************************************
SWITCHCMD /bin/cat /etc/fabos/config/vf-conf.166:
********************************************************
/bin/cat /etc/fabos/config/vf-conf.166:
SYSTEM max
ATTRIBUTE SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED:0
ATTRIBUTE BLADE_IDS1:00afaf00000000
ATTRIBUTE BLADE_IDS2:b1b10000000000
SWITCH fcsw-0
ATTRIBUTE FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS:1 TID:901059396
PIN 5
PORTMAP FC:[0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP GE:[0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
문자 수 제한에 도달한 후의 증상:
pdmd 및 hasmd 패닉 증상:
pdmd 패닉으로 인해 CP1 재부팅을 시작하여 대기 CP2가 대신합니다.
그러면 CP2에서 hasmd 패닉이 트리거되어 스위치에서 프로세서가 두 번 재부팅되고 이후 콜드 복구가 수행됩니다.
- 활성 CP1 패닉 pdm
[KSWD-1002], 204763/5877, SLOT 1 | FFDC | CHASSIS, WARNING, , Detected termination of process pdmd:2942
[HAM-1014], 204765/5878, SLOT 1 | CHASSIS, CRITICAL, , Non restartable component (pdm (pid=2942)) died
- 대기 CP2 인계, 그러나 대기 CP2도 hasmd가 있는 패닉 상태가 됨
[HAM-1004], 152469/1316, SLOT 2 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset., reboot.c
- 활성 CP 가동으로 대기 재설정 및 콜드 복구됩니다.
[EM-5012], 204809/0, SLOT 1 | CHASSIS, INFO, BPGLCG01SL35V, start emd FSS_RECOV_COLD
[HAM-1004], 5879, SLOT 1 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset.
[HAM-1004], 5942, SLOT 2 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset.
- switchshow를 사용하여 획득된 상태의 Area가 영구적으로 비활성화된 포트를 확인할 수 있습니다.
BASE:FID128:admin> switchshow | grep Area
256 1 32 338840 N16 No_Sync Disabled (Persistent) (Area has been acquired)
258 1 34 338a40 N16 No_Sync Disabled (Persistent) (Area has been acquired)
264 1 40 338040 N16 No_Sync Disabled (Persistent) (Area has been acquired)
266 1 42 338240 N16 No_Sync Disabled (Persistent) (Area has been acquired)
268 1 44 338440 N16 No_Sync Disabled (Persistent) (Area has been acquired)
270 1 46 338640 N16 No_Sync Disabled (Persistent) (Area has been acquired)
272 2 32 339840 N16 No_Sync Disabled (Persistent) (Area has been acquired)
[truncated]
- lscfg --show 출력으로 상태가 -1인 모든 포트를 표시할 수 있습니다.
SW0:FID128:admin> lscfg --show
Created switches FIDs(Domain IDs): 128(ds)(51) 127(51) 100(51) 77(51)
Slot 1 2 3 4 5 6 7 8 9 10 11 12
-------------------------------------------------------------------------------
Port
0 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
1 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
2 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
3 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
4 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
5 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
6 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
7 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
8 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
9 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
10 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
11 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
12 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
13 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
14 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
15 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
16 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
17 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
18 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
19 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
20 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
21 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
22 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
23 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
24 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
25 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
26 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
27 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
28 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
29 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
30 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
31 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
32 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
33 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
34 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
35 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
36 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
37 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
38 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
- lscfg --show 출력이 이 상태일 때 HAfailover가 실패하고 다음 오류가 표시됩니다.
hafailover >>>
can t failover because system is not ready yet or other LS/HA config is in progress.
Hashow >>>
Local CP (Slot 6, CP0): Active, Cold Recovered
Remote CP (Slot 7, CP1): Standby, Faulted
HA enabled, Heartbeat Up, HA State synchronized
FOS 8.2.x(은)는 FCOE 포트를 지원할 수 있도록 더 큰 PORTMAP 버퍼 크기를 가지고 있습니다. HA 동안 FOS 8.1.x에서 동기화된 데이터는 크기가 더 작으며 상위 포트 범위에서 관찰되는 손상된 데이터로 이어질 수 있습니다.