Host traci ścieżki.
[UWAGA: Scott, zapoznaj się także z uwagą w podsumowaniu]
Host ESX zawiesza się i wymaga ponownego uruchomienia. [Scott czy tylko hosty ESX mogą się zawiesić? Treść podsumowania: „Wszystkie HBA strefowane do VPLEX”]
Z dziennika „vmkernel” ESXi:
2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0
Z dzienników oprogramowania wewnętrznego VPLEX:
event fc/4: "This port has discovered the departure of the indicated port from the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)] [Scott - wracając do problemu: „Wszystkie HBA strefowane do VPLEX”, jeśli ten problem Cisco ma wpływ na wszystkie HBA strefowane do VPLEX, czy należy pokazywać raporty innych hostów wychodzących w dziennikach fw? Czy widzimy inne hosty wychodzące tak samo jak powyższe hosty ESX?]
event fc/3: "This port has discovered the arrival of the indicated port on the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)]
[Scott: czy widzimy te dane dla innych HBA, które też przyszły? ]
Zmiana:
Aktywacja strefy.
Porty HBA i porty front end VPLEX nie są uwzględnione w zmianach strefowania.
[Scott - to ostatnie zdanie nie jest zrozumiałe, rozumiem, że problem jest wtedy, gdy jest aktywacja zestawu stref na przełączniku Cisco i wszystkie HBA i porty FE VPLEX „są zaangażowane”. Poza tym, na jakie poziomy kodu przełącznika Cisco ma to wpływ?]
VPLEX wykonuje wykrywanie sieci szkieletowej na wszystkich portach Fibre Channel (front-end, back-end i FC-WANCOM) co 90 sekund, korzystając z polecenia serwera nazw „Get all next” (GA_NXT). Przeprowadzi tę czynność poza odbiorem RSCN z przełącznika lub PLOGI ze strefowanego HBA.
Z powodu błędu CSCvw75655 firmy Cisco, jeśli VPLEX wykonuje wykrywanie sieci szkieletowej, w przypadku portu front end (FE), podczas gdy trwa aktywacja/zatwierdzanie zbioru stref, istnieje małe prawdopodobieństwo, że do VPLEX zostanie zwrócony własny adres Fibre Channel (FCID), wówczas przyjmuje, że żaden HBA zalogowany do niego nie jest już podłączony do sieci szkieletowej, i wyśle wylogowanie (PLOGO) do każdego strefowanego w niego HBA. [Scott - czy to VPLEX i/lub dzienniki przełącznika pokazują, że ta czynność się odbywa, po wysłaniu PLOGO, jeśli to widać w obu produktach, czy możemy zawrzeć próbki, i w których dziennikach to widać?]
VPLEX zarejestruje zdarzenia fc/4 dla każdego HBA, które się wylogowuje, i zdarzenia fc/3, przy kolejnym wykryciu sieci szkieletowej w ciągu 90 sekund, kiedy otrzyma prawidłowe informacje z serwera nazw przełączników.
Sposób, w jaki HBA obsługuje to wylogowywanie, zależy od sterownika / oprogramowania sprzętowego. Host ESX w tym przykładzie zawiesił się i wymagał ponownego uruchomienia. [Scott - czy mamy dane z dzienników innych hostów, na które to zdarzenie miało wpływ? Jeśli tak, czy możemy też wymienić kilka, żeby nie wyglądało tak, że dotyczy to tylko hostów ESX?]
UWAGA:
okresowe wykrywanie sieci szkieletowej jest realizowane w celu upewnienia się, że VPLEX zaktualizował dane sieci szkieletowej, jako że jest możliwe, że nie wszystkie RSCN będą docierać do VPLEX z sieci szkieletowej.
Obejście problemu:
W przełączniku Cisco wyłącz funkcję udostępnionej bazy danych (db) serwera nazw / serwera stref w następujący sposób:
Produkty (1)
Oprogramowanie Cisco MDS 9000 NX-OS i SAN-OS
Znane wersje, których dotyczy problem
8.3(2)
VPLEX Fabric Discovery
Przykład:
Host 1, Host 2 i Host 3 objęte jednym portem FE VPLEX.
Port FE VPLEX: FCID 0x200b20
Host 1: FCID 0x340000
Host 2: FCID 0x340020
Host 3: FCID 0x340040
Pracuje... [Scott - co to jest? pobrane/skopiowane z informacji? Jeśli tak, możemy usunąć informację „pracuje...”]
Błąd Cisco CSCvw75655 ...