호스트 경로 손실.
[참고 - Scott - 요약의 참고도 참조하십시오.]
ESX 호스트가 중단되고 복구하려면 재부팅해야 합니다. [Scott - ESX 호스트만 중단시킬 수 있습니까? 요약에는 "VPLEX로 영역이 지정된 모든 HBA"라고 나와 있습니다.]
ESXi "vmkernel" 로그:
2020-08-30T03:52:23.501Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7f26e705 received from NPORT x1f04c0
2020-08-30T03:52:28.325Z cpu187:66638)WARNING: lpfc: lpfc_els_unsol_buffer:8330: 0:(0):0115 Unknown ELS command x7effc405 received from NPORT x1f04c0
VPLEX 펌웨어 로그:
event fc/4: "This port has discovered the departure of the indicated port from the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36008:<6>2020/08/30 03:39:07.65: fc/4 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) departed
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36009:<4>2020/08/30 03:39:07.65: stdf/18 FCP connection lost. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)] [Scott - "VPLEX로 영역이 지정된 모든 HBA" 문제로 다시 돌아가서 이 Cisco 문제가 VPLEX로 영역이 지정된 모든 HBA에 영향을 미치는 경우 FW 로그에서 출발하는 다른 호스트의 보고서를 표시해야 합니까? 위에 나와 있는 ESX 호스트와 동일하게 출발하는 다른 호스트를 볼 수 있습니까?]
이벤트 fc/3: "This port has discovered the arrival of the indicated port on the fabric."
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36020:<6>2020/08/30 03:40:37.66: fc/3 A0-FC02.0: port 200000109b59a55d:100000109b59a55d:330fc0
(spn Emulex PPN-10:00:00:10:9b:59:a5:5d) (snn Emulex LPe16002B-M6 FV12.2.299.27 DV12.2.373.1 HN:localhost OS:VMware ESXi 6.5.0) (speed <unsupported by fabric>) arrived
128.221.253.37/cpu0/log:5988:W/"006016abc83a153324-2":36027:<4>2020/08/30 04:03:28.34: stdf/17 FCP connection established. IT: [Host1_vmhba1 (0x100000109b59a55d)
A0-FC02 (0xc00144879a780200)]
[Scott: 다른 HBA에 대해서도 이 데이터가 도착했습니까? ]
변경:
영역 활성화.
HBA 포트와 VPLEX 프런트엔드 포트는 영역 지정 변경 사항과 관련이 없습니다.
[Scott - 이 마지막 문장은 말이 되지 않습니다. 제가 알기로 이 문제는 모든 HBA와 VPLEX FE 포트가 관련되어 있는 Cisco 스위치에서 ZoneSet이 활성화된 경우입니다. 또한 어떤 Cisco 스위치 코드 수준에 영향을 미칩니까?]
VPLEX는 모든 Fibre Channel 포트(프런트엔드, 백엔드 및 FC-WANCOM)에서 90초마다 패브릭 검색을 수행하고 "Get all next"(GA_NXT) 이름 서버 명령을 사용하여 이 작업을 수행합니다. 이 작업은 영역이 지정된 HBA에서 스위치나 PLOGI로부터 RSCN을 수신하는 외부에서 수행됩니다.
Cisco 버그(CSCvw75655) 때문에, VPLEX가 FE(Front End) 포트에서 패브릭 검색을 수행하는 경우 zoneset 활성화/커밋이 진행하는 동안 VPLEX가 자체 Fibre Channel 주소(FCID)만 반환될 가능성은 매우 적습니다. 그런 다음 로그인한 HBA가 패브릭에 더 이상 접속되어 있지 않다고 가정하고 영역이 지정된 각 HBA에 로그아웃(PLOGO)을 보냅니다. [Scott - 이 작업이 수행되어 PLOGO가 전송되는 VPLEX 및/또는 스위치 로그입니까? 두 제품 모두에서 나타날 수 있는 경우 이에 대한 샘플을 포함할 수 있습니까? 그리고 이 문제가 표시되는 로그 중 어떤 로그를 포함할 수 있습니까?]
VPLEX는 로그아웃한 모든 HBA에 대한 FC/4 이벤트와 FC/3 이벤트를 로그에 기록하며 이후 90초 패브릭 검색 시 스위치 이름 서버로부터 올바른 정보를 수신합니다.
HBA에서 이 로그아웃을 처리하는 방법은 해당 드라이버/펌웨어에 따라 다릅니다. 이 예의 ESX 호스트가 중단되어 재부팅해야 합니다. [Scott - 이 이벤트의 영향을 받는 다른 호스트에서 가져온 로그 데이터가 있습니까? 그렇다면 ESX 호스트만 영향받는 것처럼 보이지 않도록 일부 항목을 나열할 수 있습니까?]
참고:
패브릭에서 모든 RSCN이 VPLEX에 도달하지 못할 가능성이 있으므로 VPLEX가 패브릭 데이터를 정기적으로 업데이트하도록 패브릭 검색이 정기적으로 수행됩니다.
해결 방법:
Cisco 스위치에서 다음과 같이 이름 서버/영역 서버 공유 DB(Database) 기능을 비활성화합니다.
제품(1)
Cisco MDS 9000 NX-OS 및 SAN-OS 소프트웨어
영향을 받는 것으로 알려진 릴리스
8.3(2)
VPLEX 패브릭 검색
예:
호스트 1, 호스트 2 및 호스트 3이 VPLEX FE 싱글 포트로 영역이 지정됨
VPLEX FE 포트: FCID 0x200b20
호스트 1: FCID 0x340000
호스트 2: FCID 0x340020
호스트 3: FCID 0x340040
작동 중... [Scott - 이것은 무엇인가요? 정보에서 가져왔거나 복사했습니까? 그렇다면 "working..." 정보를 제거할 수 있습니다.]
Cisco 버그 CSCvw75655 ...