Uppdatering 2018-02-01
– Det här problemet har åtgärdats i en uppdaterad version av den fasta programvaran och drivrutinen för Mellanox CX4
I ett hyperkonvergerat kluster som implementerats med Dell EMC Microsoft Storage Spaces Direct Ready Nodes med Dell EMC PowerEdge R740xd- och Mellanox CX4 LX-adaptrar för lagringstrafik kan du se SMB-klientfel (händelse-ID 30803) i Windows Loggboken (program- och tjänstloggar –> Microsoft –> Windows –> SMB-klient –> anslutning) när en klusternod startas om.
Även om detta är normalt i ett redundanskluster under en omstart av en nod kan du ibland se dessa fel dyka upp igen på klusternoderna med jämna mellanrum även efter att alla klusternoder är fullt fungerande. Det här beteendet beror på ett fel vid skapandet av SMB-lyssnare för varje lagringsgränssnitt i noden som startades om. De här felen visas på de kvarvarande noderna i klustret och inte på noden som startades om. Felbeskrivningen anger den server som SMB-klienten försöker ansluta till och serveradressen i beskrivningen anger den nod som just startades om.
I ett normalt funktionstillstånd för klusternoderna, efter en omstart av noden, bör körning netstat –xan visa en IPv4- och IPv6-lyssnare som är associerad med varje lagringsgränssnitt på noden. Följande utdata från netstat.exe samlades in på en nod med två lagringskort.
Aktiva NetworkDirect-anslutningar, lyssnare, SharedEndpoints
Läge IfIndex Typ Lokal adress Utländsk adressPID
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:61476 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:62244 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:61988 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:62756 0
Kärna 4-anslutning 10.128.100.101:12541 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:12797 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:14077 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:14333 10.128.100.100:445 0
Kärna 14-anslutning 10.128.100.133:445 10.128.100.132:27454 0
Kärna 14-anslutning 10.128.100.133:445 10.128.100.132:27198 0
Kärna 14-anslutning 10.128.100.133:237510.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:62535 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:62791 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:64071 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:64327 10.128.100.132:445 0
Kernel 4-lyssnare [fe80::4cae:cb05:4932:f226%4]:445 NA 0
Kernel 4-lyssnare 10.128.100.101:445 NA 0
Kernel 14-lyssnare 10.128.100.133:445 NA 0
Kernel 14-lyssnare [fe80::5180:55b6:c0f0:ae8d%14]:445 NA 0
Utdatalista 1 – fullt fungerande SMB-stack
Men när du börjar se SMB-klientfelen i klustret kanske noden som startades om inte har alla lyssnare associerade med varje lagringsgränssnitt i systemet.
Aktiva NetworkDirect-anslutningar, lyssnare, SharedEndpoints
Läge IfIndex Typ Lokal adress Utländsk adressPID
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:61476 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:62244 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:61988 0
Kärna 4-anslutning 10.128.100.101:445 10.128.100.100:62756 0
Kärna 4-anslutning 10.128.100.101:12541 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:12797 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:14077 10.128.100.100:445 0
Kärna 4-anslutning 10.128.100.101:14333 10.128.100.100:445 0
Kärna 14-anslutning 10.128.100.133:2375 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:62535 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:62791 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:64071 10.128.100.132:445 0
Kärna 14-anslutning 10.128.100.133:64327 10.128.100.132:445 0
Kernel 4-lyssnare [fe80::4cae:cb05:4932:f226%4]:445 NA 0
Kernel 4-lyssnare 10.128.100.101:445 NA 0
Utdatalista 2 – SMB-stack saknar en lyssnare
I exemplet ovan kommer därför SMB-klienten som försöker ansluta till gränssnittsindex 14 så småningom att resultera i meddelanden om nekad anslutning och SMB-klientfel (händelse-ID 30803) relaterade till RDMA
Nätverksarkitekturen Dell EMC Microsoft Ready Node rekommenderar två lagringskort per klusternod. Det uppstår inga störningar i klusterfunktionerna när det här problemet uppstår. Dessutom kan det kort som saknar en lyssnare fortfarande användas för att skicka RDMA-trafik. Men eftersom det inte finns någon lyssnare på något av lagringskorten går det inte att skriva med RDMA. Det här kortet återgår till att använda TCP för skrivningar eller mottagande av trafik. Detta kan resultera i lägre skrivprestanda beroende på arbetsbelastningen. Det finns inga dataförluster eller funktionsbegränsningar när det här problemet uppstår.
Detta har identifierats som en bugg i drivrutinen för Mellanox CX4 LX WinOF2 version 1.70 och tidigare.
SMB-lyssnaren kan återskapas genom att starta om det virtuella lagringskortet som inte har någon associerad SMB-lyssnare efter en omstart. Du kan identifiera rätt virtuellt kort att starta om genom att följa stegen som beskrivs nedan.
Från netstat -xan-utdata kan du se att det saknas en lyssnare för ett av lagringskorten. Gränssnittsindexet för det saknade kortet kan hittas med hjälp av cmdleten Get-NetAdapter.
PS C:\> Get-NetAdapter
Namn GränssnittBeskrivning ifIndex Status MacAddress LinkSpeed
______________ __ ___________________ ____ ______vEthernet (lagring2) Hyper-V Virtual Ethernet-adapter #3 14 upp 00-15-5D-09-C4-0210 Gbit/s
vEthernet (lagring1) Hyper-V Virtual Ethernet-adapter #2 4 upp 00-15-5D-09-C4-0110 Gbit/s
vEthernet (hantering)Hyper-V Virtual Ethernet Adapter 10 upp 00-15-5D-09-C4-0010 Gbit/s
Ethernet-fjärr-NDIS kompatibel enhet 9 finns inte 50-9A-4C-A7-F9-DF 0 bps
NIC2 Intel(R) Ethernet 10G X710 rNDC 6 frånkopplad 24-6E-96-52-CC-A410 Gbit/s
NIC4 Intel(R) I350 Gigabit Nätverksanslutning ... 15 frånkopplad 24-6E-96-52-CC-C3 0 bps
NIC3 Intel(R) I350 Gigabit nätverksanslutning... #2 8 frånkopplad 24-6E-96-52-CC-C2 0 bps
NIC1 Intel(R) Ethernet 10G 4P X710/I350 rNDC 13 frånkopplad 24-6E-96-52-CC-A210 Gbit/s
KORTPLATS 1 Port 2 Mellanox ConnectX-4 Lx Ethernet Ad... #2 2 upp 24-8A-07-59-4C-6910 Gbit/s
KORTPLATS 1 Port 1 Mellanox ConnectX-4 Lx Ethernet Adapter 11 upp 24-8A-07-59-4C-6810 Gbit/s
Genom att titta på netstat –xan-utdata (visas i utdatalista 2) kan du se att gränssnittet med index 14 inte har någon lyssnare associerad med sig. Från cmdleten Get-NetAdapter kan du se att gränssnittsindex 14 är det virtuella kortet vEthernet (Storage2).
Obs! Namnet på nätverkskortet kan skilja sig åt beroende på hur du har namngett lagringskort i hanteringsoperativsystemet.Nu kan du starta om gränssnittet med saknad lyssnare.
Restart-NetAdapter –Ge namnet "vEthernet (Storage2)"
När den här processen är klar kan du kontrollera netstat –xan för att säkerställa att lyssnaren skapas. Processen kan ta några minuter. När lyssnaren har skapats börjar klusternoderna kommunicera normalt via RDMA och nya SMB-klientfel slutar visas i loggboken.