Opdatering 2/1/2018
- Dette problem er rettet i en opdateret version af Mellanox CX4-firmware og -driver
I en hyperkonvergeret klynge, der er implementeret ved hjælp af Dell EMC Microsoft Storage Spaces Direct Ready Nodes med Dell EMC PowerEdge R740xd- og Mellanox CX4 LX-adaptere til storagetrafik, kan du muligvis se SMB-klientfejl (hændelses-id 30803) i Windows-logbog (Logfiler for programmer og tjenester -> Microsoft -> Windows -> SMB-klient -> Tilslutningsmuligheder), når en klyngenode genstartes.
Selvom dette er normalt i en failover-klynge under en nodegenstart, kan du lejlighedsvis se disse fejl dukke op igen på klyngenoderne med jævne mellemrum, selv efter at alle klyngenoder er fuldt funktionelle. Denne funktionsmåde skyldes en fejl i oprettelsen af SMB-lytterne for hver storagegrænseflade i den node, der blev genstartet. Disse fejl vises på de tilbageværende noder i klyngen og ikke på den node, der blev genstartet. Fejlbeskrivelsen angiver den server, som SMB-klienten forsøger at oprette forbindelse til, og serveradressen i beskrivelsen angiver den node, der netop er genstartet.
I en normal funktionel tilstand af klyngenoderne bør kørsel af netstat –xan efter en nodegenstart vise en IPv4- og IPv6-lyttefunktion, der er tilknyttet hver lagergrænseflade på noden. Følgende output af netstat.exe blev samlet på en node med to lageradaptere.
Aktive NetworkDirect-forbindelser, lyttere, delte slutpunkter
Tilstand IfIndex Type Lokal adresse Fremmed adressePID
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:61476 0
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:62244 0
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:61988 0
Kerne 4-forbindelse 10.128.100.101:445 10.128.100.100:62756 0
Kerne 4-forbindelse 10.128.100.101:12541 10.128.100.100:445 0
Kerne 4-forbindelse 10.128.100.101:12797 10.128.100.100:445 0
Forbindelse til kerne 4 10.128.100.101:14077 10.128.100.100:445 0
Forbindelse til kerne 4 10.128.100.101:14333 10.128.100.100:445 0
Kerne 14-forbindelse 10.128.100.133:445 10.128.100.132:27454 0
Kerne 14-forbindelse 10.128.100.133:445 10.128.100.132:27198 0
Kerne 14-forbindelse 10.128.100.133:237510.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:62535 10.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:62791 10.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:64071 10.128.100.132:445 0
Forbindelse til kerne 14 10.128.100.133:64327 10.128.100.132:445 0
Kerne 4 Listener [fe80::4cae:cb05:4932:f226%4]:445 NA 0
Kerne 4 Listener 10.128.100.101:445 NA 0
Kerne 14 Listener 10.128.100.133:445 NA 0
Kerne 14 Listener [fe80::5180:55b6:c0f0:ae8d%14]:445 NA 0
Outputliste 1 – Fuldt funktionel SMB-stak
Men når du begynder at se SMB-klientfejl i klyngen, har den node, der blev genstartet, muligvis ikke alle lyttefunktioner tilknyttet alle lagergrænseflader i systemet.
Aktive NetworkDirect-forbindelser, lyttere, delte slutpunkter
Tilstand IfIndex Type Lokal adresse Fremmed adressePID
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:61476 0
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:62244 0
Forbindelse til kerne 4 10.128.100.101:445 10.128.100.100:61988 0
Kerne 4-forbindelse 10.128.100.101:445 10.128.100.100:62756 0
Kerne 4-forbindelse 10.128.100.101:12541 10.128.100.100:445 0
Kerne 4-forbindelse 10.128.100.101:12797 10.128.100.100:445 0
Forbindelse til kerne 4 10.128.100.101:14077 10.128.100.100:445 0
Forbindelse til kerne 4 10.128.100.101:14333 10.128.100.100:445 0
Kerne 14-forbindelse 10.128.100.133:2375 10.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:62535 10.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:62791 10.128.100.132:445 0
Kerne 14-forbindelse 10.128.100.133:64071 10.128.100.132:445 0
Forbindelse til kerne 14 10.128.100.133:64327 10.128.100.132:445 0
Kerne 4 Listener [fe80::4cae:cb05:4932:f226%4]:445 NA 0
Kerne 4 Listener 10.128.100.101:445 NA 0
Outputliste 2 - SMB-stak mangler en lytter
I ovenstående eksempel vil SMB-klienter, der forsøger at oprette forbindelse på grænsefladeindeks 14, derfor i sidste ende resultere i meddelelser om afvisning af forbindelse og SMB-klientfejl (hændelses-id 30803), der er relateret til RDMA
Dell EMC Microsoft Ready Node-netværksarkitekturen anbefaler to storageadaptere pr. klyngenode. Der vil ikke være nogen afbrydelse i klyngefunktionaliteten, når dette problem opstår. Desuden kan den adapter, der mangler en lyttefunktion, stadig bruges til at sende RDMA-trafik. Da der imidlertid ikke er nogen lytter på en af storageadapterne, kan skrivninger ved hjælp af RDMA ikke udføres. Denne adapter vender tilbage til at bruge TCP til skrivninger eller modtagelse af trafik. Dette kan resultere i lavere skriveydeevne afhængigt af arbejdsbelastningen. Der er ingen datatab eller funktionalitetsbegrænsninger, når dette problem opstår.
Dette er blevet identificeret som en fejl i Mellanox CX4 LX WinOF2-driverversionerne 1.70 og derunder.
SMB-lyttefunktionen kan genoprettes ved at genstarte den virtuelle storageadapter, der ikke har nogen tilknyttet SMB-lyttefunktion, efter en genstart. Du kan identificere den rigtige virtuelle adapter til genstart ved at følge nedenstående trin.
Fra netstat -xan-udgangen kan du se, at der mangler en lytter til en af lageradapterne. Grænsefladeindekset for den manglende adapter kan findes ved hjælp af cmdlet'en Get-NetAdapter.
PS C:\> Get-NetAdapter
Navn GrænsefladeBeskrivelse ifIndex Status MacAddress LinkSpeed
______________ __ ___________________ ____ ______vEthernet (Storage2) Hyper-V Virtual Ethernet-adapter #3 14 op 00-15-5D-09-C4-0210 Gbps
vEthernet (Storage1) Hyper-V Virtual Ethernet-adapter #2 4 op 00-15-5D-09-C4-0110 Gbps
vEthernet (Management)Hyper-V Virtual Ethernet-adapter 10 op 00-15-5D-09-C4-0010 Gbps
Ethernet Remote NDIS-kompatibel enhed 9 ikke til stede 50-9A-4C-A7-F9-DF 0 bps
NIC2 Intel(R) Ethernet 10G X710 rNDC 6 frakoblet 24-6E-96-52-CC-A410 Gbps
NIC4 Intel(R) i350 Gigabit netværksforbindelse ... 15 Frakoblet 24-6E-96-52-CC-C3 0 bps
NIC3 Intel(R) i350 Gigabit netværkskonn... #2 8 Afbrudt 24-6E-96-52-CC-C2 0 bps
NIC1 Intel(R) Ethernet 10G 4P X710/I350 rNDC 13 frakoblet 24-6E-96-52-CC-A210 Gbps
SLOT 1 Port 2 Mellanox ConnectX-4 Lx Ethernet Ad... #2 2 op 24-8A-07-59-4C-6910 Gbps
SLOT 1, 1. port, Mellanox ConnectX-4 Lx, Ethernet-adapter 11, op 24-8A-07-59-4C-6810 Gbps
Ved at se på netstat –xan-outputtet (vist i outputliste 2) kan du se, at grænsefladen med indeks 14 ikke har nogen lytter tilknyttet. Fra cmdlet'en Get-NetAdapter kan du se, at grænsefladeindeks 14 er den virtuelle adapter vEthernet (Storage2).
Bemærk: Dette netværkskortnavn kan være anderledes, afhængigt af hvordan du har navngivet storageadaptere i administrationsoperativsystemet.Du kan nu genstarte grænsefladen med manglende lytter.
Restart-NetAdapter – navn 'vEthernet (Storage2)'
Når denne proces er fuldført, kan du kontrollere netstat –xan for at sikre, at lytteren oprettes. Denne proces kan tage et par minutter. Når lyttefunktionen er oprettet, begynder klyngenoderne at kommunikere normalt via RDMA, og nye SMB-klientfejl vises ikke længere i logbogen.