Symptômes
VSAN health check find disk failure or vmware-vsan-health-summary-result.log find physdiskoverall health is red/yellow .log find physdiskoverall health is red/yellow (VsAN helsesjekk finner diskfeil eller vmware-vsan-health-summary-result.log find physdiskoverall health is red/yellow).
VxRail-Virtual-SAN-Cluster-xxxxxxxxx Generell tilstand: red
Group physicaldisks health : red
Test physdiskoverall health : red
DisksWithIssues: Host Disk OverallOperationHealth Metadata Operational InCmmds/Vsi OperationalState Recommendation Uuid
(Vert-10, LocalTcheckbaDisk (Naa.50000xxxxxxxx), rød, grønn, rød, ja/ja, foreståendePermanentDiskFailure, PstFailedDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjectsvsandevicemonitord.log
INFO vsandevicemonitord WARNING – WRITE Average Latency on VSAN device naa.50000xxxxxx has exceeded threshold value 200000 us 2 times (ADVARSEL – GJENNOMSNITTLIG VENTETID FOR SKRIVE PÅ VSAN-enhet naa.50000xxxxxxxx har overskredet terskelverdien 2000000 oss to ganger).
INFO vsandevicemonitord Tier 2 (naa.50000xxxxxx) som usunt
Cause
Sperrediskhåndteringsfunksjonen (DDH) i VSAN diagnostiserer disk-/diskgruppetilstanden ved å oppdage enten overdreven I/U-ventetid for en vSAN-disk eller maksimal loggoverbelastning som vSAN avgjør skyldes logglekkasjeproblemer i en vSAN-diskgruppe over en lengre periode.
Usunte disker/diskgrupper er merket som sådan, og på dette tidspunktet brukes ikke diskene/diskgruppene lenger til ny dataplassering.
Når DDH oppdager at en disk har overskredet terskelen for I/O-ventetid i løpet av overvåkingsintervallet, genererer vSAN en VMkernel Observation (VOB) og logger en melding til vsandevicemonitord.log-filen i katalogen /var/run/log. Loggoppføringen nedenfor er et eksempel på en disk som må skiftes ut når den nødvendige datadisken er fullført, og disken er i en "evakuert"-tilstand:
ADVARSEL – SKRIV gjennomsnittlig ventetid på VSAN-enhet har overskredet terskelen for oss < antall intervaller med overdreven I/U-ventetid> ganger.
Når DDH oppdager at et hurtigbufringsnivå har overdreven loggoverbelastning under overvåkingsintervallet, vil vSAN generere en VOB og logge på vsandevicemonitord.log-filen. Meldinger om overdreven overbelastning av logger er i dette formatet:
ADVARSEL – Maksimal overbelastning av logger på VSAN-enhet /
I begge disse situasjonene utløses vSAN avsperring av enkelte eller alle data fra de berørte disk-/diskgruppene. Delen om generell disktilstand i brukergrensesnittet for vSAN-tilstandsovervåking rapporterer noen av følgende driftstilstander for de berørte diskene/diskgruppene sammen med anbefalinger for brukeren. Anbefalingene etter at den uforsiktikten er fullført, vil variere avhengig av om vSAN oppdaget overdreven I/U-ventetid eller overdreven overbelastning av loggen.
Résolution
Se VMware KB:
https://kb.vmware.com/s/article/2148358?lang=en_us
Det må du ikke fjerne/skifte ut disken i situasjoner nedenfor når vSAN-resynkronisering pågår. Hvis du gjør dette, kan det forekomme tap av data.
Forestående permanent diskfeil, databehandling mislyktes på grunn av utilstrekkelige ressurser (tilstand – rød)
Eller
Forestående permanent diskfeil, dataforedling mislyktes på grunn av utilgjengelige objekter (tilstand – rød)
Ikke fjern/erstatt disken når objektet er utilgjengelig.
Objektet er utilgjengelig, noe som betyr at alle kopier av objektet mangler, hvis du fjerner/erstatter disken som kan forårsake DL.
Løsningen:
- Koble til VMware
- Hvis overdreven I/U-ventetid forårsaket at kapasitetsdisken var usunt, gjenoppretter du disken ved å montere den på nytt. Når du monterer disken på nytt, endres ikke vSAN UUID for disken.
Demontering av esxcli vsan storage diskgroup -d
esxcli vsan storage diskgroup mount -d
Produits concernés
VMware VSAN