Symptômes
VSAN-tilstandskontrol find diskfejl eller vmware-vsan-health-summary-result.log find physdiskoverall-sundhed er rød/gul.
VxRail-Virtual-SAN-Cluster-xxxxxxxxx Overordnet tilstand: Rød
gruppe fysiske diskes sundhed: red
Test physdiskoverall health: red
DisksWithIssues: Host Disk OverallOperationHealth Metadata Operational Incmmds/Vsi OperationalState Recommendation Uuid
(Host-10, LocalToshibaDisk(Naa.50000xxxxxxx), rød, grøn, rød, ja/ja, snarligPermanentDiskFailure, CeriledDueToInaccessibleObjects, PleaseReferTo'Data'HealthCheckAndResolveTheInaccessibleObjectsv
andevicemonitord.log
INFO v andevitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx have exceeded threshold value 2000000 us 2 gange.
INFO v ogevitord Tier 2 (naa.50000xxxxxxxx) som usund
Cause
Funktionen til diskhåndtering (DDH) i VSAN diagnosticerer disk-/diskgruppetilstand ved at registrere enten overdreven IO-ventetid for en vSAN-disk eller maksimal overbelastning af logfiler, som vSAN vurderer skyldes problemer med loglækage i en vSAN-diskgruppe over en længere periode.
Usunde diske/diskgrupper er markeret som sådan, og på dette tidspunkt bruges diske/diskgrupper ikke længere til ny dataplacering.
Når DDH registrerer, at en disk har overskredet IO-ventetidsgrænsen under overvågningsintervallet, vil vSAN generere en VMkernel Observation (VOB) og logføre en meddelelse til vsandevicemonitord.log-filen i /var/run/log-mappen. Logposten nedenfor er et eksempel på en disk, der skal udskiftes, når de påkrævede data er fuldført, og disken er i en "tømmet" tilstand:
ADVARSEL - WRITE Average Latency on VSAN device has exceeded threshold value us < antal intervaller med overdreven IO-ventetid> gange.
Når DDH registrerer, at et cachelagringsniveau har overdreven overbelastning af logfilerne under overvågningsintervallet, vil vSAN generere en VOB og logge på v andevicemonitord.log-filen. Meddelelser om overbelastning af logfiler er i dette format:
ADVARSEL – Maksimal overbelastning af logfiler på VSAN-enhed /
I begge disse situationer udløser vSAN nogle eller alle data fra de berørte disk-/diskgrupper. Afsnittet "generelle disketilstand" i brugergrænsefladen for vSAN-tilstandsovervågning rapporterer en af følgende driftstilstande for de berørte diske/diskgrupper sammen med anbefalinger til brugeren. Anbefalingerne, når flugten er fuldført, varierer afhængigt af, om vSAN har fundet for mange IO-latens eller overbelastning af logfilerne.
Résolution
Se VMware KB:
https://kb.vmware.com/s/article/2148358?lang=en_us
Du
må ikke fjerne/udskifte disk i nedenstående situationer, når vSAN gensynkroniseres løbende. Hvis du gør det, kan der forekomme datatab.
Snarlig permanent diskfejl, datadebatteri mislykkedes på grund af utilstrækkelige ressourcer (tilstand - rød)
Eller
Snarlig permanent diskfejl, datadåse mislykkedes på grund af utilgængelige objekter (tilstand - rød)
Du må ikke fjerne/udskifte disken, når objektet ikke er tilgængeligt.
Objekt utilgængeligt betyder, at alle kopier af objektet mangler, hvis du fjerner/udskifter disken, der kan forårsage DL.
Løsning:
- Iværksæt VMware
- Hvis overdreven IO-ventetid har medført, at kapacitetsdisken er usund, skal du genoprette disken ved at tilslutte den igen. Hvis du tilkobler disken igen, ændres diskens vSAN UUID ikke.
esxcli vsan storage diskgroup unmount -d
esxcli vsan storage diskgroup mount -d
Produits concernés
VMware VSAN