Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

Errori del client SMB dopo il riavvio di un nodo cluster

Summary: Sebbene ciò sia normale in un cluster di failover durante il riavvio di un nodo, è possibile che questi errori vengano occasionalmente visualizzati nuovamente sui nodi del cluster a intervalli regolari anche dopo che tutti i nodi del cluster sono completamente funzionanti. ...

This article applies to   This article does not apply to 

Symptoms

Errori del client SMB dopo il riavvio di un nodo cluster

Aggiornamento 01/02/2018

- Questo problema è stato risolto in una versione aggiornata del firmware e del driver Mellanox CX4

Cause

Descrizione del problema


In un cluster iperconvergente implementato utilizzando Dell EMC Microsoft Storage Spaces Direct Ready Nodes con adattatori Dell EMC PowerEdge R740xd e Mellanox CX4 LX per il traffico di storage, è possibile che vengano visualizzati errori del client SMB (ID evento 30803) nel visualizzatore eventi di Windows (registri di applicazioni e servizi -> Microsoft -> Windows -> client SMB -> Connettività) quando un nodo del cluster viene riavviato.

Sebbene ciò sia normale in un cluster di failover durante il riavvio di un nodo, è possibile che questi errori vengano occasionalmente visualizzati nuovamente sui nodi del cluster a intervalli regolari anche dopo che tutti i nodi del cluster sono completamente funzionanti. Questo comportamento è dovuto a un errore nella creazione dei listener SMB per ogni interfaccia di storage nel nodo riavviato. Questi errori vengono visualizzati sui nodi rimanenti del cluster e non sul nodo riavviato. La descrizione dell'errore indica il server a cui il client SMB sta tentando di connettersi e l'indirizzo del server nella descrizione indica il nodo appena riavviato.

In uno stato funzionale normale dei nodi del cluster, dopo il riavvio di un nodo, l'esecuzione di netstat –xan dovrebbe mostrare un listener IPv4 e IPv6 associato a ogni interfaccia di storage sul nodo. Il seguente output di netstat.exe è stato raccolto su un nodo con due schede di storage.

Connessioni NetworkDirect attive, listener, SharedEndpoints

Modalità IfIndex Tipo Indirizzo locale Indirizzo esternoPID

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:61476 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:62244 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:61988 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:62756 0

Connessione Kernel 4 10.128.100.101:12541 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:12797 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:14077 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:14333 10.128.100.100:445 0

Kernel 14 Connessione 10.128.100.133:445 10.128.100.132:27454 0

Kernel 14 Connessione 10.128.100.133:445 10.128.100.132:27198 0

Kernel 14 Connessione 10.128.100.133:237510.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:62535 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:62791 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:64071 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:64327 10.128.100.132:445 0

Listener del kernel 4 [fe80::4cae:cb05:4932:f226%4]:445 NA 0

Listener del kernel 4 10.128.100.101:445 NA 0

Kernel 14 Listener 10.128.100.133:445 NA 0

Kernel 14 Listener [fe80::5180:55b6:c0f0:ae8d%14]:445 NA 0

Output 1 - Stack SMB completamente funzionale

Tuttavia, quando si iniziano a visualizzare gli errori del client SMB nel cluster, il nodo riavviato potrebbe non avere tutti i listener associati a ogni interfaccia di storage nel sistema.

Connessioni NetworkDirect attive, listener, SharedEndpoints

Modalità IfIndex Tipo Indirizzo locale Indirizzo esternoPID

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:61476 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:62244 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:61988 0

Connessione Kernel 4 10.128.100.101:445 10.128.100.100:62756 0

Connessione Kernel 4 10.128.100.101:12541 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:12797 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:14077 10.128.100.100:445 0

Connessione Kernel 4 10.128.100.101:14333 10.128.100.100:445 0

Kernel 14 Connessione 10.128.100.133:2375 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:62535 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:62791 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:64071 10.128.100.132:445 0

Kernel 14 Connessione 10.128.100.133:64327 10.128.100.132:445 0

Listener del kernel 4 [fe80::4cae:cb05:4932:f226%4]:445 NA 0

Listener del kernel 4 10.128.100.101:445 NA 0

Output 2 - Stack SMB mancante di un listener

Pertanto, nell'esempio precedente, il client SMB che tenta di connettersi sull'indice dell'interfaccia 14 alla fine genera messaggi di connessione rifiutata ed errori del client SMB (ID evento 30803) correlati a RDMA
 

Impatto

L'architettura di rete Dell EMC Microsoft Ready Node consiglia due schede di storage per ogni nodo del cluster, non si verificherà alcuna interruzione della funzionalità del cluster quando si verifica questo problema. Inoltre, l'adattatore a cui manca un listener può comunque essere utilizzato per inviare il traffico RDMA. Tuttavia, poiché non è presente alcun listener su una delle schede di storage, non è possibile eseguire scritture utilizzando RDMA. Questo adapter esegue il fallback utilizzando TCP per qualsiasi scrittura o ricezione del traffico. Ciò potrebbe comportare prestazioni di scrittura inferiori a seconda del carico di lavoro. Quando si verifica questo problema, non vi è alcuna perdita di dati o limitazioni di funzionalità.
 

Dov'è il problema?

Questo problema è stato identificato come un bug nel driver Mellanox CX4 LX WinOF2 versione 1.70 e precedenti.

Resolution

Procedura di correzione

Il listener SMB può essere ricreato riavviando la scheda di storage virtuale che non dispone di un listener SMB associato dopo un riavvio. È possibile identificare la scheda virtuale giusta da riavviare seguendo la procedura descritta di seguito.

 

Identificare la scheda in base all'indice dell'interfaccia


Dall'output di netstat -xan è possibile vedere che manca un listener per una delle schede di storage. È possibile trovare l'indice dell'interfaccia per l'adattatore mancante utilizzando il cmdlet Get-NetAdapter.

PS C:\> Get-NetAdapter

Nome InterfaceDescrizione ifIndex Stato MacIndirizzo LinkSpeed

______________ __ ___________________ ____ ______

vEthernet (Storage2) Hyper-V Virtual Ethernet Adapter #3 14 up 00-15-5D-09-C4-0210 Gbps

vEthernet (Storage1) Hyper-V Virtual Ethernet Adapter #2 4 up 00-15-5D-09-C4-0110 Gbps

vEthernet (gestione)Hyper-V Virtual Ethernet Adapter da 10 fino a 00-15-5D-09-C4-0010 Gbps

Dispositivo Ethernet remoto compatibile con NDIS 9 Non presente 50-9A-4C-A7-F9-DF 0 bps

NIC2 Intel(R) Ethernet 10G X710 rNDC 6 Disconnesso 24-6E-96-52-CC-A410 Gbps

NIC4 Intel(R) I350 Gigabit Network Connec... 15 Disconnesso 24-6E-96-52-CC-C3 0 bps

NIC3 Intel(R) I350 Gigabit Network Conn... #2 8 Disconnesso 24-6E-96-52-CC-C2 0 bps

NIC1 Intel(R) Ethernet 10G 4P X710/I350 rNDC 13 Disconnesso 24-6E-96-52-CC-A210 Gbps

SLOT 1 Porta 2 Mellanox ConnectX-4 Lx Ethernet Ad... #2 2 Fino a 24-8A-07-59-4C-6910 Gbps

SLOT 1 Porta 1 Adattatore Ethernet Mellanox ConnectX-4 Lx 11 fino a 24-8A-07-59-4C-6810 Gbps

 

Identificare e riavviare l'interfaccia senza listener associato


Osservando l'output netstat –xan (mostrato nell'Output Listing 2), è possibile notare che l'interfaccia con l'indice 14 non ha alcun listener associato. Dal cmdlet Get-NetAdapter è possibile notare che l'indice dell'interfaccia 14 è la scheda virtuale vEthernet (Storage2). 

SLN313313_en_US__1icon Nota: Il nome della scheda di rete può variare in base al modo in cui sono state denominate le schede di storage nel sistema operativo di gestione.

È ora possibile riavviare l'interfaccia con il listener mancante.

Restart-NetAdapter –Name 'vEthernet (Storage2)'

Una volta completato questo processo, è possibile controllare netstat –xan per assicurarsi che il listener sia stato creato. This process may take a few minutes. Una volta creato il listener, i nodi del cluster inizieranno a comunicare normalmente su RDMA e i nuovi errori del client SMB smetteranno di essere visualizzati nel visualizzatore eventi.

Affected Products

Dell EMC Microsoft Storage Spaces Direct Ready Nodes