Dit artikel is van toepassing op zowel VxRail 7.x als VxRail 8.x versies.
Bij de vSAN-healthcheck wordt een schijfstoring opgespoord, of vmware-vsan-health-summary-result.log
Vindt physdiskoverall
Gezondheid is rood of geel.
VxRail-Virtual-SAN-Cluster-xxxxxxxxx Overall Health : red Group physicaldisks health : red Test physdiskoverall health : red DisksWithIssues: Host Disk OverallOperationHealth Metadata Operational InCmmds/Vsi OperationalState Recommendation Uuid (Host-10, LocalToshibaDisk(Naa.50000xxxxxxxxxx), Red, Green, Red, Yes/Yes, ImpendingPermanentDiskFailure,EvacuationFailedDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjects
vsandevicemonitord.log reports:
INFO vsandevicemonitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx has exceeded threshold value 2000000 us 2 times. INFO vsandevicemonitord Tier 2 (naa.50000xxxxxxxx) as unhealthy
De DDH-functie (Dying Disk Handling) van vSAN diagnosticeert de status van de schijf of schijfgroep door overmatige I/O-latentie voor een vSAN-schijf te detecteren of maximale logcongestie die volgens vSAN te wijten is aan loglekproblemen in een vSAN-schijfgroep gedurende een langere periode. Beschadigde schijf of schijfgroepen worden als zodanig gemarkeerd en de schijf of schijfgroepen worden niet meer gebruikt voor nieuwe dataplaatsing.
Wanneer DDH detecteert dat een schijf de I/O-latentiedrempel heeft overschreden tijdens het bewakingsinterval, genereert vSAN een VMkernel Observation (VOB) en registreert een bericht op de vsandevicemonitord.log
bestand in de /var/run/log
map. De onderstaande logboekvermelding is een voorbeeld van een schijf die moet worden vervangen zodra de vereiste data-evacuatie is voltooid en de schijf zich in een geëvacueerde status bevindt:
WARNING - WRITE Average Latency on VSAN device <NAA disk name> has exceeded threshold value <IO latency threshold for disk> us <# of intervals with excessive IO latency> times.
Wanneer DDH detecteert dat een cachinglaag tijdens het bewakingsinterval overmatige logdrukte heeft, genereert vSAN een VOB en logboek naar de vsandevicemonitord.log
bestand. Berichten over overmatige logoverbelasting hebben deze indeling:
WARNING - Maximum log congestion on VSAN device <NAA disk name> <current intervals with excessive log congestion>/<intervals required to be unhealthy>
In beide situaties activeert vSAN de evacuatie van sommige of alle data van de betreffende schijf of schijfgroepen. Het gedeelte algehele schijfstatus in de gebruikersinterface voor vSAN-statuscontrole rapporteert een van de volgende operationele statussen voor de betreffende schijf of schijfgroepen, samen met aanbevelingen voor de gebruiker. De aanbevelingen nadat de evacuatie is voltooid, verschillen afhankelijk van of vSAN overmatige I/O-latentie of overmatige logcongestie heeft gedetecteerd.
Zie VMware-artikel 326878, Dying Disk Handling (DDH) in vSAN
Verwijder of vervang de schijf niet tijdens de onderstaande situaties waarin vSAN opnieuw wordt gesynchroniseerd. Als u dat doet, kan er gegevensverlies optreden.
Impending permanent disk failure, data evacuation failed due to insufficient resources (Health state - Red)
Of
Impending permanent disk failure, data evacuation failed due to inaccessible objects (Health state - Red)
Verwijder of vervang geen schijf wanneer het object ontoegankelijk is.
Object ontoegankelijk betekent dat alle kopieën van het object ontbreken. Als u een schijf verwijdert of vervangt, kan dit leiden tot dataverlies.
Tijdelijke oplossing:
esxcli vsan storage diskgroup unmount -u <disk group UUID> esxcli vsan storage diskgroup mount -u <disk group UUID>