Symptômes
VSAN health check find disk failure or vmware-vsan-health-summary-result.log find physdiskoverall health is red/yellow.
VxRail-Virtual-SAN-Cluster-xxxxxxxxx Algemene status: red
Group physicaldisks health: red
Test physdiskoverall health: red
DisksWithIssues: Host Disk OverallOperationHealth Metadata Operational InCmmds/Vsi OperationalState Recommendation Uuid
(Host-10, LocalToshibaDisk (Naa.50000xxxxxxxxxxxxx), Red, Green, Red, Yes/Yes, ImpendingPermanentDiskFailure, EvacuationFailedDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjectsvsandevicemonitord.log
INFO vsandevicemonitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx has exceeded threshold value 2000000 us 2 times.
INFO vsandevicemonitord Tier 2 (naa.50000xxxxxxxx) als onveilig
Cause
Met de functie 'Nieuwe schijfafhandeling' (DDH) van VSAN wordt de status van de schijf/schijfgroep vastgesteld door een overmatige IO-latentie voor een vSAN-schijf te detecteren of een maximale logboekcongestie die door vSAN wordt vastgesteld als gevolg van problemen met logboeklekken in een vSAN-schijfgroep gedurende een langere periode.
Beschadigde schijven/schijfgroepen zijn als zodanig gemarkeerd en op dit punt worden de schijven/schijfgroepen niet meer gebruikt voor de plaatsing van nieuwe data.
Wanneer DDH detecteert dat een schijf de I/O-latentiedrempel heeft overschreden tijdens het controle-interval, genereert vSAN een VMkernel-observatie (VOB) en registreert u een bericht in het bestand vsandevicemonitord.log in de directory /var/run/log. De onderstaande logboekvermelding is een voorbeeld van een schijf die moet worden vervangen zodra de vereiste gegevensactivatie is voltooid en de schijf zich in een "geëvacueerde" staat bevindt:
WAARSCHUWING - WRITE Average Latency on VSAN device has exceeded threshold us times.
Wanneer DDH detecteert dat een cachelaag een overmatige logboekcongestie heeft tijdens het controleinterval, genereert vSAN een VOB en logt u naar het bestand vsandevicemonitord.log. Meldingen over overmatige logboekcongestie hebben deze indeling:
WAARSCHUWING - Maximale logboekcongestie op VSAN-apparaat /
In beide situaties activeert vSAN de verwijdering van sommige of alle data uit de betreffende schijf-/schijfgroepen. Het gedeelte "algemene status van schijven" in de gebruikersinterface voor vSAN-statuscontrole rapporteert een van de volgende operationele statussen voor de getroffen schijven/schijfgroepen, samen met aanbevelingen voor de gebruiker. De aanbevelingen nadat de verwijdering is voltooid, verschillen afhankelijk van of vSAN buitensporige IO-latentie heeft gedetecteerd of overmatige logboekcongestie.
Résolution
Raadpleeg VMware KB:
https://kb.vmware.com/s/article/2148358?lang=en_us
Please verwijdert/vervangt de schijf niet tijdens de onderstaande situaties wanneer vSAN resync bezig is. Als u dat doet, kan data verloren gaan.
Dreigende permanente schijfstoring, dataactivatie mislukt vanwege onvoldoende resources (status - rood)
Of
Dreigende permanente schijfstoring, dataactivatie mislukt vanwege ontoegankelijke objecten (status - rood)
Verwijder/vervang de schijf niet wanneer het object niet toegankelijk is.
Object niet toegankelijk betekent dat alle kopieën van het object ontbreken, als u de schijf verwijdert/vervangt die DL kan veroorzaken.
Oplossing:
- VMware inschakelen
- Als een overmatige I/O-latentie de capaciteitsschijf onevenwichtig heeft veroorzaakt, herstelt u de schijf door deze opnieuw te koppelen. Door de schijf opnieuw te koppelen, wordt vSAN UUID van de schijf niet gewijzigd.
esxcli vsan storage diskgroup unmount -d
esxcli vsan storage diskgroup mount -d
Produits concernés
VMware VSAN