Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Коммутатор Cisco MDS: хосты теряют путь к внешним портам VPLEX при активации зоны

Summary: При активации зоны все HBA-адаптеры, зонированные с внешним портом VPLEX, выходят из системы и теряют путь. Хосты ESX могут зависать и требовать перезагрузки для восстановления. [Скотт — Это влияет только на хосты ESX? В сводке написано «Все HBA-адаптеры, зонированные с VPLEX», мы хотим ограничиться только хостами ESX, или перефразировать следующим образом: «Хосты могут зависать и требовать перезагрузки для восстановления»?] ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Хосты теряют пути.
[ПРИМЕЧАНИЕ — Скотт, посмотри также примечание в сводке]

Хост ESX зависает и требует перезагрузки для восстановления. [Скотт — Зависают только хосты ESX? В сводке указано «все HBA-адаптеры, зонированные с VPLEX»]

Из журнала ESXi «vmkernel»:

2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0


Из журналов микропрограммы VPLEX:
event fc/4:  "This port has discovered the departure of the indicated port from the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]
[Скотт — Вернемся к проблеме «все HBA-адаптеры, зонированные с VPLEX», если эта проблема Cisco затрагивает все HBA-адаптеры для VPLEX, нужно ли показывать отчеты об отключении других хостов в журналах микропрограммы? Наблюдается ли отключение других хостов так же, как хоста esx, показанного выше?]

event fc/3: "This port has discovered the arrival of the indicated port on the fabric."

128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0 
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established.  IT: [Host1_vmhba1 (0x100000109b59a55d) 
A0-FC02 (0xc00144879a780200)]

[Скотт: Есть ли у нас данные для других HBA-адаптеров? ]


Изменение.
Активация зоны.
Порты HBA-адаптеров и внешние порты VPLEX не участвуют в изменениях зонирования.
[Скотт — Это последнее предложение не имеет смысла, насколько я понимаю, проблема заключается в том, что при активации набора зон на коммутаторах Cisco участвуют все HBA-адаптеры и внешние порты VPLEX. Также, на какие уровни кода коммутаторов Cisco это влияет?]

Cause

VPLEX выполняет обнаружение фабрики на всех портах Fibre Channel (внешних, внутренних и FC-WANCOM) каждые 90 секунд с помощью команды сервера имен «Get all next» (GA_NXT). Это будет выполняться независимо от приема RSCN от коммутатора или PLOGI от зонального HBA-адаптера.

Из-за ошибки Cisco CSCvw75655, если система VPLEX выполняет обнаружение фабрики, на внешнем порте (FE), в то время как выполняется активация/фиксация набора зон, существует небольшая вероятность, что VPLEX получит только собственный адрес Fibre Channel (FCID), затем предположит, что ни один из HBA-адаптеров, вошедших в систему, больше не подключен к фабрике, и отправит команду выхода из системы (PLOGO) на каждый зонированный HBA-адаптер. [Скотт — Являются ли журналы VPLEX и/или коммутаторов, на которых происходит это действие, отправление PLOGO, если это можно увидеть на обоих продуктах, можно ли включить примеры этого и в каких журналах это наблюдается?]

VPLEX будет регистрировать события fc/4 для каждого выходящего HBA-адаптера и события fc/3, при следующем 90-секундном обнаружении фабрики, когда получает правильную информацию от сервера имен коммутаторов.

Способ обработки этого выхода HBA-адаптером зависит от драйвера/микропрограммы. В данном примере хост ESX завис и требовал перезагрузки. [Скотт - есть ли у нас данные из журналов других хостов, затронутых этим событием? Если да, то можно ли перечислить некоторые из них, чтобы не выглядело так, будто затронуты только хосты ESX?]

ПРИМЕЧАНИЕ.
Периодическое обнаружение фабрики выполняется, чтобы убедиться, что в системе VPLEX обновлены данные фабрики, поскольку существует вероятность, что не все сети RSCN установят соединение с VPLEX из фабрики.

Resolution

Временное решение

На коммутаторе Cisco отключите функцию общей базы данных (db) сервера имен/сервера зон следующим образом:
 

switch# no zoneset capability active mode shared-db vsan <vsan-id>


ПРИМЕЧАНИЕ. Функция общей базы данных набора зон — это просто полезное действие, при котором сервер имен и сервер зон совместно используют информацию. Отключение функции не оказывает негативного влияния на среду.

Cisco подтверждает, что изменение является локальным, а не глобальным. Эта команда должна выполняться на каждом коммутаторе, к которому подключена система VPLEX. [Скотт — Есть ли в базе знаний Cisco статья, в которой говорится об этой проблеме, на которую можно ссылаться в этой статье базы знаний?]

Исправление.

NX-OS 8.4(2c). Эта версия не была выпущена в общий доступ компанией Dell EMC.
[Скотт — Мы не можем включать исправления, которые еще не доступны в Dell EMC. Когда они станут доступны, нужно повторно опубликовать статью базы знаний и удалить предложение «Эта версия не была выпущена в общий доступ компанией Dell EMC»]

Additional Information

Продукты (1)
ПО Cisco MDS 9000 NX-OS и SAN-OS

Известные затронутые выпуски
8.3(2)

. Обнаружение фабрики VPLEX

Пример.
Хост 1, хост 2 и хост 3 зонированы с одним внешним портом VPLEX.

Порт FE VPLEX: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020 
Host 3: FCID 0x340040 

Working... [Scott - Что это? Это взято/скопировано из раздела информации? Если да, то можно удалить информацию «working...»]

 

  1. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) «0xffffff» (наибольший)
  2. Сервер имен ответит с подробными сведениями о порте FE VPLEX (наименьший)
  3. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) порта FE VPLEX
  4. Сервер имен ответит с подробными сведениями о хосте 1
  5. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 1
  6. Сервер имен ответит с подробными сведениями о хосте 2
  7. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 2
  8. Сервер имен ответит с подробными сведениями о хосте 3
  9. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) хоста 3
  10. Сервер имен ответит с подробными сведениями о порте FE VPLEX
  11. В этот момент VPLEX останавливается, так как получает уже обнаруженный (перечеркнутый) адрес Fibre Channel (FCID)

Ошибка Cisco CSCvw75655 ...

 

  1. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) «0xffffff» (наибольший)
  2. Сервер имен ответит с подробными сведениями о порте FE VPLEX (наименьший)
  3. VPLEX отправит команду «Get all next» на сервер имен с адресом Fibre Channel (FCID) порта FE VPLEX
  4. Сервер имен ответит с подробными сведениями о порте FE VPLEX
  5. В этот момент VPLEX останавливается, так как получает уже обнаруженный (перечеркнутый) адрес Fibre Channel (FCID)

Дополнительные сведения об исправлении ошибки CSCvw75655 , добавленные в NX-OS 8.4(2c).
 
Напоминание о причинах этой ошибки:
 
Проблема возникает, когда целевое устройство отправляет команду FCNS GA_NXT и получает только собственный FCID, указывая на то, что оно не зонировано с другими устройствами. Некоторые целевые устройства периодически отправляют команду GA_NXT; они не управляются RSCN или другими методами и поэтому уязвимы для этой проблемы.
Причина заключается в том, что при выполнении активации/фиксации набора зон существует небольшой промежуток времени, в течение которого FCNS возвращает в ответ на GA_NXT только FCID отправителя, и ни одного FCID устройств, с которыми выполнено зонирование. Это является следствием использования функции общей базы данных набора зон, реализованной в Cisco MDS NX-OS 7.3(0)D1(1). 

 
Это описание исправления от Cisco:

В рамках активации начинается деактивация, которая очищает SDB. После очистки SDB она отправляет уведомление всем подписчикам. Теперь это не происходит. Кроме того, добавлена новая последовательность, которая отправляет уведомление о фиксации SDB отдельно. Это позволит создать SDB и отправить одно окончательное уведомление 
Исправление имеется только в версии 8.4(2c).

 
SDB = общая база данных набора зон.

Article Properties


Affected Product

VPLEX, Connectrix MDS-Series Firmware 7.X, Connectrix MDS-Series Firmware 8.X, VMware ESXi 6.5.X

Product

Connectrix, Connectrix MDS-Series, Connectrix MDS-Series Firmware, VMware ESXi, VPLEX GeoSynchrony, VPLEX Series, VPLEX VS6

Last Published Date

19 Aug 2021

Version

4

Article Type

Solution