Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Коммутатор Cisco MDS: хосты теряют путь к внешним портам VPLEX при активации зоны

Summary: При активации зоны все HBA-адаптеры, зонированные с внешним портом VPLEX, выходят из системы и теряют путь. Хосты ESX могут зависать и требовать перезагрузки для восстановления. [Скотт — Это влияет только на хосты ESX? В сводке написано «Все HBA-адаптеры, зонированные с VPLEX», мы хотим ограничиться только хостами ESX, или перефразировать следующим образом: «Хосты могут зависать и требовать перезагрузки для восстановления»?] ...

This article applies to   This article does not apply to 

Symptoms

Хосты теряют пути.
[ПРИМЕЧАНИЕ — Скотт, посмотри также примечание в сводке]

Хост ESX зависает и требует перезагрузки для восстановления. [Скотт — Зависают только хосты ESX? В сводке указано «все HBA-адаптеры, зонированные с VPLEX»]

Из журнала ESXi «vmkernel»:

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


Из журналов микропрограммы VPLEX:
event fc/4:  "This port has discovered the departure of the indicated port from the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Скотт — Вернемся к проблеме «все HBA-адаптеры, зонированные с VPLEX», если эта проблема Cisco затрагивает все HBA-адаптеры для VPLEX, нужно ли показывать отчеты об отключении других хостов в журналах микропрограммы? Наблюдается ли отключение других хостов так же, как хоста esx, показанного выше?]

event fc/3: "This port has discovered the arrival of the indicated port on the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Скотт: Есть ли у нас данные для других HBA-адаптеров? ]


Изменение.
Активация зоны.
Порты HBA-адаптеров и внешние порты VPLEX не участвуют в изменениях зонирования.
[Скотт — Это последнее предложение не имеет смысла, насколько я понимаю, проблема заключается в том, что при активации набора зон на коммутаторах Cisco участвуют все HBA-адаптеры и внешние порты VPLEX. Также, на какие уровни кода коммутаторов Cisco это влияет?]

Cause

VPLEX выполняет обнаружение фабрики на всех портах Fibre Channel (внешних, внутренних и FC-WANCOM) каждые 90 секунд с помощью команды сервера имен «Get all next» (GA_NXT). Это будет выполняться независимо от приема RSCN от коммутатора или PLOGI от зонального HBA-адаптера.

Из-за ошибки Cisco CSCvw75655, если система VPLEX выполняет обнаружение фабрики, на внешнем порте (FE), в то время как выполняется активация/фиксация набора зон, существует небольшая вероятность, что VPLEX получит только собственный адрес Fibre Channel (FCID), затем предположит, что ни один из HBA-адаптеров, вошедших в систему, больше не подключен к фабрике, и отправит команду выхода из системы (PLOGO) на каждый зонированный HBA-адаптер. [Скотт — Являются ли журналы VPLEX и/или коммутаторов, на которых происходит это действие, отправление PLOGO, если это можно увидеть на обоих продуктах, можно ли включить примеры этого и в каких журналах это наблюдается?]

VPLEX будет регистрировать события fc/4 для каждого выходящего HBA-адаптера и события fc/3, при следующем 90-секундном обнаружении фабрики, когда получает правильную информацию от сервера имен коммутаторов.

Способ обработки этого выхода HBA-адаптером зависит от драйвера/микропрограммы. В данном примере хост ESX завис и требовал перезагрузки. [Скотт - есть ли у нас данные из журналов других хостов, затронутых этим событием? Если да, то можно ли перечислить некоторые из них, чтобы не выглядело так, будто затронуты только хосты ESX?]

ПРИМЕЧАНИЕ.
Периодическое обнаружение фабрики выполняется, чтобы убедиться, что в системе VPLEX обновлены данные фабрики, поскольку существует вероятность, что не все сети RSCN установят соединение с VPLEX из фабрики.

Resolution

Временное решение

На коммутаторе Cisco отключите функцию общей базы данных (db) сервера имен/сервера зон следующим образом:
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


ПРИМЕЧАНИЕ. Функция общей базы данных набора зон — это просто полезное действие, при котором сервер имен и сервер зон совместно используют информацию. Отключение функции не оказывает негативного влияния на среду.

Cisco подтверждает, что изменение является локальным, а не глобальным. Эта команда должна выполняться на каждом коммутаторе, к которому подключена система VPLEX. [Скотт — Есть ли в базе знаний Cisco статья, в которой говорится об этой проблеме, на которую можно ссылаться в этой статье базы знаний?]

Исправление.

NX-OS 8.4(2c). Эта версия не была выпущена в общий доступ компанией Dell EMC.
[Скотт — Мы не можем включать исправления, которые еще не доступны в Dell EMC. Когда они станут доступны, нужно повторно опубликовать статью базы знаний и удалить предложение «Эта версия не была выпущена в общий доступ компанией Dell EMC»]

Additional Information

Продукты (1)
ПО Cisco MDS 9000 NX-OS и SAN-OS

Известные затронутые выпуски
8.3(2)

. Обнаружение фабрики VPLEX

Пример.
Хост 1, хост 2 и хост 3 зонированы с одним внешним портом VPLEX.

Порт FE VPLEX: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020 
Host 3: FCID 0x340040 

Working... [Scott - Что это? Это взято/скопировано из раздела информации? Если да, то можно удалить информацию «working...»]

 

  1. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) «0xffffff» (наибольший)
  2. Сервер имен ответит с подробными сведениями о порте FE VPLEX (наименьший)
  3. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) порта FE VPLEX
  4. Сервер имен ответит с подробными сведениями о хосте 1
  5. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 1
  6. Сервер имен ответит с подробными сведениями о хосте 2
  7. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 2
  8. Сервер имен ответит с подробными сведениями о хосте 3
  9. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 3
  10. Сервер имен ответит с подробными сведениями о порте FE VPLEX
  11. В этот момент VPLEX останавливается, так как получает уже обнаруженный (перечеркнутый) адрес Fibre Channel (FCID)

Ошибка Cisco CSCvw75655 ...

 

  1. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) «0xffffff» (наибольший)
  2. Сервер имен ответит с подробными сведениями о порте FE VPLEX (наименьший)
  3. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) порта FE VPLEX
  4. Сервер имен ответит с подробными сведениями о порте FE VPLEX
  5. В этот момент VPLEX останавливается, так как получает уже обнаруженный (перечеркнутый) адрес Fibre Channel (FCID)

Дополнительные сведения об исправлении ошибки CSCvw75655 , добавленные в NX-OS 8.4(2c).
 
Напоминание о причинах этой ошибки:
 
Проблема возникает, когда целевое устройство отправляет команду FCNS GA_NXT и получает только собственный FCID, указывая на то, что оно не зонировано с другими устройствами. Некоторые целевые устройства периодически отправляют команду GA_NXT; они не управляются RSCN или другими методами и поэтому уязвимы для этой проблемы.
Причина заключается в том, что при выполнении активации/фиксации набора зон существует небольшой промежуток времени, в течение которого FCNS возвращает в ответ на GA_NXT только FCID отправителя, и ни одного FCID устройств, с которыми выполнено зонирование. Это является следствием использования функции общей базы данных набора зон, реализованной в Cisco MDS NX-OS 7.3(0)D1(1). 

 
Это описание исправления от Cisco:

В рамках активации начинается деактивация, которая очищает SDB. После очистки SDB она отправляет уведомление всем подписчикам. Теперь это не происходит. Кроме того, добавлена новая последовательность, которая отправляет уведомление о фиксации SDB отдельно. Это позволит создать SDB и отправить одно окончательное уведомление 
Исправление имеется только в версии 8.4(2c).

 
SDB = общая база данных набора зон.

Affected Products

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Products

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6