Скачивание микропрограммы между FOS v8.1.x и FOS v8.2.x
Влияние.
- Холодное восстановление коммутатора класса Director
- Пользователь выполняет операцию lscfg, которая завершается сбоем с событием raslog PMGR-1006
Условия эксплуатации.
Оборудование Dell EMC: Connectrix ED-DCX6-4B
Оборудование Dell EMC: Connectrix ED-DCX6-8B
Программное обеспечение Dell EMC: Connectrix серии B Fabric OS (FOS) 8.1
Программное обеспечение Dell EMC: Connectrix серии B Fabric OS (FOS) 8.2
Проблема.
При обновлении с FOS 8.1.x до FOS 8.2.x может создаваться недопустимый набор диапазонов портов в записи PORTMAP файла конфигурации виртуальной фабрики (VF).
Это может произойти только на коммутаторах класса Director X6-8 или X6-4 после обновления до FOS 8.2.0 или более поздних версий с более ранней версии FOS, и размер записи PORTMAP увеличивается до значения >= 1024.
Размер записи PORTMAP может превысить 1024 символа только после многократного перемещения портов между логическими коммутаторами с помощью команды интерфейса командной строки «lscfg». Текущий размер записи PORTMAP может быть рассчитан следующим образом:
- Используя команду интерфейса командной строки «configupload -vf», найдите загруженный файл конфигурации, затем выполните «grep PORTMAP <uploaded-configuration-filename>» и подсчитайте символы, начиная с символа «F» или «G» и заканчивая символом «]».
Коммутаторы класса Director X6-8 или X6-4, поставляемые с завода с установленной FOS 8.2.0 или более поздней версии, не подвержены этой проблеме, если они не были понижены до версии FOS, предшествующей 8.2.0, а затем вновь модернизированы до версии FOS 8.2.0 или более поздней.
Признак.
Коммутаторы БЕЗ VF.
- Пользователи, у которых НЕ включена VF, не увидят каких-либо внешних признаков.
- При исследовании записи PORTMAP в конфигурации VF могут отображаться неверные номера портов в таблице сопоставления, но без включения VF эти недопустимые записи номеров портов не влияют на работу коммутатора.
- Любые номера портов от 1800 до 3399 считаются «недопустимыми записями».
- Это не повлияет на работу системы без VF. Однако, если используются логические фабрики или планируется включить их в будущем, эти недопустимые записи следует удалить.
Любое ограничение числа символов, превышающее или приближающееся к 1024, должно быть уменьшено для устранения/предотвращения указанных выше признаков после достижения предела для символов.
Коммутаторы с включенной VF.
Пользователи, у которых включена VF, видят влияние только в том случае, если размер записи PORTMAP в файле конфигурации VF превышает 1024 записи.
Это может произойти, если происходит повторное перемещение портов с одного логического коммутатора на другой. Размер таблицы может быть проверен администратором, чтобы определить, приближается ли она к точке отказа.
Проверка PORTMAP.
- Как пользователь с правами администратора, выполните команду «configupload -vf». Вывод можно использовать для просмотра записей PORTMAP в файле конфигурации VF.
В нем отображаются PORTMAP FC и GE, а также PORTMAP для всех логических коммутаторов.
- Чтобы вручную проверить ограничение на 1024 символа, подсчитайте символы от «F» или «G» до конечного «]» или обратитесь в службу поддержки.
Пример:
FC PORTMAP из загруженного ниже файла примера содержит 528 символов.
GE PORTMAP из загруженного ниже файла примера содержит 510 символов.
Признаки достижения предела символов.
Пример загруженного файла:
# BROCADE
# VERSION 822
# PLATFORM 166
# SWITCHCONF
SYSTEM max
ATTRIBUTE SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED:0
ATTRIBUTE BLADE_IDS1:00afafbab20000
ATTRIBUTE BLADE_IDS2:b1b10000000000
SWITCH fcsw-0
ATTRIBUTE FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS:1 TID:775683370
PIN 5
PORTMAP FC:[0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP GE:[0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP также можно найти в файле RAS supportsave. (Не RAS_POST; только RAS.)
Она может появляться несколько раз, так как supportsave выполняет «cat» файлов vf-conf.<swbd>, switch-conf.<swbd> и .save. «cat» в vf-conf.<swbd> — это лучший вариант для использования.
Пример из файла supportsave switch0-xxx.xxx.xx.xxx-S1cp-202001152137.RAS.txt:
********************************************************
SWITCHCMD /bin/cat /etc/fabos/config/vf-conf.166:
********************************************************
/bin/cat /etc/fabos/config/vf-conf.166:
SYSTEM max
ATTRIBUTE SYS_NAME:sw0
ATTRIBUTE VF:0
ATTRIBUTE ETHSW_ENABLED:0
ATTRIBUTE BLADE_IDS1:00afaf00000000
ATTRIBUTE BLADE_IDS2:b1b10000000000
SWITCH fcsw-0
ATTRIBUTE FID:128 SWNAME:sw0 USR:3400 GE:256 ICL:128 DS:1 TID:901059396
PIN 5
PORTMAP FC:[0-447,768-895,1152-1215,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
PORTMAP GE:[0-255,1816-1823,1848-1855,1880-1887,1912-1919,1944-1951,1976-1983,2008-2015,2040-2047,2072-2079,2104-2111,2136-2143,2168-2175,2200-2207,2232-2239,2264-2271,2296-2303,2328-2335,2360-2367,2392-2399,2424-2431,2456-2463,2488-2495,2520-2527,2552-2559,2584-2591,2616-2623,2648-2655,2680-2687,2712-2719,2744-2751,2776-2783,2808-2815,2840-2847,2872-2879,2904-2911,2936-2943,2968-2975,3000-3007,3032-3039,3064-3071,3096-3103,3128-3135,3160-3167,3192-3199,3224-3231,3256-3263,3288-3295,3320-3327,3352-3359,3384-3391]
Признаки после достижения лимита символов.
Признаки тревоги pdmd и hasmd.
Резервный CP2 принимает на себя нагрузку, инициируя перезагрузку CP1 из-за pdmd panic.
После этого на CP2 срабатывает hasmd panic, что приводит к двойной перезагрузке процессора на коммутаторе и последующему холодному восстановлению.
- Активный CP1 panic pdm
[KSWD-1002], 204763/5877, SLOT 1 | FFDC | CHASSIS, WARNING, , Detected termination of process pdmd:2942
[HAM-1014], 204765/5878, SLOT 1 | CHASSIS, CRITICAL, , Non restartable component (pdm (pid=2942)) died
- CP2 переходит из режима ожидания в рабочий режим, но на нем срабатывает тревога hasmd
[HAM-1004], 152469/1316, SLOT 2 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset., reboot.c
- Активный CP переходит к сбросу режима ожидания и холодному восстановлению
[EM-5012], 204809/0, SLOT 1 | CHASSIS, INFO, BPGLCG01SL35V, start emd FSS_RECOV_COLD
[HAM-1004], 5879, SLOT 1 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset.
[HAM-1004], 5942, SLOT 2 | CHASSIS, INFO, BPGLCG01SL35V, Processor rebooted - Reset.
- В switchshow могут быть порты, которые постоянно отключены со статусом «Area has been acquired»:
BASE:FID128:admin> switchshow | grep Area
256 1 32 338840 N16 No_Sync Disabled (Persistent) (Area has been acquired)
258 1 34 338a40 N16 No_Sync Disabled (Persistent) (Area has been acquired)
264 1 40 338040 N16 No_Sync Disabled (Persistent) (Area has been acquired)
266 1 42 338240 N16 No_Sync Disabled (Persistent) (Area has been acquired)
268 1 44 338440 N16 No_Sync Disabled (Persistent) (Area has been acquired)
270 1 46 338640 N16 No_Sync Disabled (Persistent) (Area has been acquired)
272 2 32 339840 N16 No_Sync Disabled (Persistent) (Area has been acquired)
[truncated]
- Вывод lscfg show может показать, что ВСЕ порты имеют статус -1
SW0:FID128:admin> lscfg --show
Created switches FIDs(Domain IDs): 128(ds)(51) 127(51) 100(51) 77(51)
Slot 1 2 3 4 5 6 7 8 9 10 11 12
-------------------------------------------------------------------------------
Port
0 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
1 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
2 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
3 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
4 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
5 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
6 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
7 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
8 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
9 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
10 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
11 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
12 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
13 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
14 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
15 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
16 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
17 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
18 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
19 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
20 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
21 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
22 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
23 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
24 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
25 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
26 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
27 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
28 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
29 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
30 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
31 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
32 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
33 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
34 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
35 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
36 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
37 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
38 | | | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 | -1 |
- Если выходной сигнал lscfg --show находится в указанном ниже состоянии, аварийное переключение HAFailover будет выполнено со следующей ошибкой:
hafailover >>>
can t failover because system is not ready yet or other LS/HA config is in progress.
Hashow >>>
Local CP (Slot 6, CP0): Active, Cold Recovered
Remote CP (Slot 7, CP1): Standby, Faulted
HA enabled, Heartbeat Up, HA State synchronized
FOS 8.2.x имеет больший размер буфера PORTMAP для поддержки портов FCOE. Данные, синхронизированные из FOS 8.1.x при высокой доступности, меньше по размеру и могут привести к появлению поврежденных данных в более высоких диапазонах портов.