Fyysisen vSAN-levyn tilan tarkistaminen verkkokäyttöliittymästä:
Yhdistä vCenter Server Web Client -sovellukseen ja tarkista levyn tila kohdasta
Varaston > Isäntä ja klusterit > vSAN-klusteri Määritä > vSAN-levynhallinta Kuva 1: vSAN-levynhallintanäkymä Valitse kyseinen isäntä ja laajenna sitten Näytä levy -osa:Kuva 2: vSAN-levyryhmänäkymä >>
Tässä voit tarkistaa, tunnistetaanko levy seuraavasti:
Epäterveellinen
Asentamaton
0 kapasiteetti
Pysyvä levyvika
Levy alaspäin
Levy puuttuu
Tarkista myös levyyn liittyvät hälytykset, jotka käynnistyvät vSAN Skyline Health -osassa:
Varaston > Isäntä ja klusterit vSAN-klusterinäyttö >> vSAN > Skyline Health > Fyysinen levy Kuva 3:>
Skyline Health -näkymä
Täällä voit tarkistaa, onko jokin seuraavista hälytyksistä lauennut:
Uhkaava pysyvä levyvika, tietoja evakuoidaan (Kuntotila - keltainen).
Uhkaava pysyvä levyvika, tietojen evakuointi epäonnistui riittämättömien resurssien vuoksi (terveydentila - punainen).
Lähestyvä pysyvä levyvika, tietojen evakuointi epäonnistui, koska objekteja ei voi käyttää (Kuntotila - punainen).
Uhkaava pysyvä levyvika, tietojen evakuointi valmis (kuntotila – keltainen)
Voit myös tarkistaa levyn tilan haavoittuvuuden sisältävän isännän tallennuslaiteluettelosta:
Varaston > Isäntä ja klusterit > vSAN-klusteri, jota ongelma koskee, vSAN ESXi ->isäntä > Tallennuslaitteiden >>
määrittäminen Kuva 4: Isäntätallennuslaitteiden näkymä
Täällä voit tarkistaa, onko levyn tila
0 Kapasiteetti
Levy puuttuu
Levy ei ole käytössä
Tarkista onko käynnissä uudelleensynkronointi:
Varaston > Isäntä ja klusterit > vSAN-klusterinäyttö > vSAN > Objektien > uudelleensynkronointi:Kuva 5:
Objektien näkymän uudelleensynkronointi
HUOMAUTUS: Uudelleensynkronointi voi tarkoittaa, että tietoja evakuoidaan levyltä tai levyryhmästä, jota ongelma koskee. Lisätutkimuksia tarvitaan sen selvittämiseksi, onko viallinen levy valmis poistettavaksi tai vaihdettavaksi.
Tarkista vSAN-objektien tila:
Varaston > Isäntä ja klusterit > vSAN-klusterinäyttö > vSAN Skyline Health > Data > vSAN object health Kuva 6: vSAN-objektin >>kuntonäkymä
HUOMAUTUS: On tärkeää varmistaa, että esteettömiä esineitä ei ole. Objekti ei ole käytettävissä tarkoittaa "kaikki kohteen kopiot puuttuvat". Jos poistat tai vaihdat levyn, se voi aiheuttaa DL: n.
Seuraavaksi kerätään lisätietoja ongelmasta komentoriviliittymässä ja tarkistetaan lokit:Fyysisen vSAN-levyn tilan tarkistaminen komentoriviliittymästä:
Yhdistä SSH:n kautta isäntään, jota ongelma koskee, ja suorita seuraavat komennot:
vdq -qH
Tarkista "IsPDL" (pysyvä laitteen menetys) -parametri. Jos se on yhtä suuri kuin 1, levy menetetään.
Esimerkki:
DiskResults:
DiskResult[0]:
Name: naa.600508b1001c4b820b4d80f9f8acfa95
VSANUUID: 5294bbd8-67c4-c545-3952-7711e365f7fa
State: In-use for VSAN
ChecksumSupport: 0
Reason: Non-local disk
IsSSD?: 0
IsCapacityFlash?: 0
IsPDL?: 0
<<truncated>>
DiskResult[18]:
Name:
VSANUUID: 5227c17e-ec64-de76-c10e-c272102beba7
State: In-use for VSAN
ChecksumSupport: 0
Reason: None
IsSSD?: 0
IsCapacityFlash?: 0
IsPDL?: 1
vdq -iH
Tarkista, puuttuuko levyryhmästä levy.
Esimerkki:
Mappings:
DiskMapping[0]:
SSD: naa.58ce38ee2016ffe5
MD: naa.5002538a4819e3e0
DiskMapping[2]:
SSD: naa.58ce38ee2016fe55
MD: naa.5002538a48199ca0
MD: naa.5002538a48199e20
MD: naa.5002538a48199e00
esxcli vsan storage list
Tarkista In CMMDS -parametri. Jos se on epätosi, yhteys levylle katkeaa.
Esimerkki:
Device: Unknown
Display Name: Unknown
Is SSD: false
VSAN UUID: 529cadbc-acd1-b588-8643-68336d5512d6
VSAN Disk Group UUID:
VSAN Disk Group Name:
Used by this host: false
In CMMDS: false
On-disk format version: <Unknown>
Deduplication: false
Compression: false
Checksum:
Checksum OK: false
Is Capacity Tier: false
for i in `esxcli storage core device list | grep ^naa` ; do echo $i; esxcli storage core device smart get -d $i; done.
Tarkista luku/kirjoitusvirheet smart get -komennolla.
Esimerkki:
naa.55cd2e404c1f35a1
Parameter Value Threshold Worst Raw
-------------------------- ----- --------- ----- ---
Health Status OK N/A N/A N/A
Media Wearout Indicator 100 0 100 86
Read Error Count 130 39 130 133
Power-on Hours 100 0 100 110
Power Cycle Count 100 0 100 106
Drive Temperature 100 0 100 26
Uncorrectable Sector Count 100 0 100 0
naa.55cd2e404c1f35a5
Parameter Value Threshold Worst Raw
-------------------------- ----- --------- ----- ---
Health Status OK N/A N/A N/A
Media Wearout Indicator 100 0 100 10
Read Error Count 130 39 130 53
Power-on Hours 100 0 100 110
Power Cycle Count 100 0 100 106
Drive Temperature 100 0 100 27
Uncorrectable Sector Count 100 0 100 0
esxcli vsan storage list | grep "VSAN Disk Group UUID:" | sort | uniq -c
Tarkista käytettävissä olevat levyryhmät.
Esimerkki:
2 VSAN Disk Group UUID: 5203424c-ee56-497d-75d1-fcf73ae997cb
2 VSAN Disk Group UUID: 52af8e5c-77d1-b552-3310-ec5fef09edf4
while true;do echo " ****************************************** "; echo "" > /tmp/resyncStats.txt ;cmmds-tool find -t DOM_OBJECT -f json |grep uuid |awk -F \" '{print $4}' |while read i;do pendingResync=$(cmmds-tool find -t DOM_OBJECT -f json -u $i|grep -o "\"bytesToSync\": [0-9]*,"|awk -F " |," '{sum+=$2} END{print sum / 1024 / 1024 / 1024;}');if [ ${#pendingResync} -ne 1 ]; then echo "$i: $pendingResync GiB";fi;done |tee -a /tmp/resyncStats.txt;total=$(cat /tmp/resyncStats.txt |awk '{sum+=$2} END{print sum}');echo "Total: $total GiB" |tee -aa /tmp/resyncStats.txt;total=$(cat /tmp/resyncStats.txt |grep Total);totalObj=$(cat /tmp/resyncStats.txt|grep -vE " 0 GiB|Total"|wc -l);echo "`date +%Y-%m-%dT%H:%M:%SZ` $total ($totalObj objects)" >> /tmp/totalHistory.txt; echo `date `; sleep 60; done
Tarkista, onko käynnissä tai jumissa uudelleensynkronointitoimintoja.
Esimerkki:
Total: 0 GiB
Mon Feb 13 17:32:06 UTC 2023
Lopeta komento
painamalla Ctrl+C .
cmmds-tool find -f python | grep CONFIG_STATUS -B 4 -A 6 | grep 'uuid\|content' | grep -o 'state\\\":\ [0-9]*' | sort | uniq -c
Tarkista komponenttien tila.
Terve -- tila 7
Saavuttamaton -- tila 13
Puuttuu tai heikentynyt -- tila 15
Esimerkki:
425 state\": 7
Kuinka tunnistaa viallisen SSD-levyn tai kiintolevyn sijainti komentoriviliittymässä:
Luettele kaikki käytettävissä olevat laitteet:
esxcli storage core device list | grep "naa" | awk '{print $1}' | grep "naa"
Esimerkki:
naa.5000c500852df8d3
naa.55cd2e404c1f35a1
naa.55cd2e404c1f35a5
naa.5000c500852dd5e7
Tarkista sijainti luettelon kunkin levyn naa: n avulla:
esxcli storage core device physical get -d
Esimerkki:
esxcli storage core device physical get -d naa.5000c500852df8d3
esxcli storage core device physical get -d naa.55cd2e404c1f35a1
esxcli storage core device physical get -d naa.55cd2e404c1f35a5
esxcli storage core device physical get -d naa.5000c500852dd5e7
Physical Location: enclosure 65535 slot 0
Physical Location: enclosure 65535 slot 1
Physical Location: enclosure 65535 slot 2
Physical Location: enclosure 65535 slot 3
Viallisen kiintolevyn tai SSD-levyn tunnistaminen, jos laitteen nimi puuttuu:
On mahdollista, että viallista levyä ei havaita eikä sitä voida tunnistaa vastaavan naa: n avulla. Tässä tilanteessa on löydettävä kaikki levyt, ja se, joka ei sijaitse fyysisesti, epäonnistuu.
Tässä on komentosarja, jota voidaan käyttää tehtävän suorittamiseen hieman nopeammin:
echo "=============Physical disks placement=============="
echo ""
esxcli storage core device list | grep "naa" | awk '{print $1}' | grep "naa" | while read in; do
echo "$in"
esxcli storage core device physical get -d "$in"
sleep 1
echo "===================================================="
done
Tallennukseen liittyvät vSAN-lokit:
/var/log/vmkernel.log
Ongelmat vSAN-levyjen, vSAN-isännän sydämenlyöntien, PDL:ien, SCSI-anturikoodien ja I/O-pyyntöjen (luku/kirjoitus) sekä klusterin jäsenyystietojen lukemisessa ja kirjoittamisessa.
Esimerkki:
2021-06-22T12:02:08.408Z cpu30:1001397101)ScsiDeviceIO: PsaScsiDeviceTimeoutHandlerFn:12834: TaskMgmt op to cancel IO succeeded for device naa.55cd2e404b7736d0 and the IO did not complete. WorldId 0, Cmd 0x28, CmdSN = 0x428.Cancelling of IO will be
2021-06-22T12:02:08.408Z cpu30:1001397101)retried.
/var/log/vobd.log
Raportoi levyn kunnosta, laitteen pysyvistä kadonneista levyistä (PDL) ja levyn viiveestä sekä raportoi, milloin isäntä siirtyy ylläpitotilaan ja poistuu siitä.
Esimerkki:
2022-05-31T11:42:46.065Z: [vSANCorrelator] 10605891965954us: [vob.vsan.lsom.devicerepair] vSAN device 521a74ce-c980-c16c-ff3d-38a036233daf is being repaired due to I/O failures, and will be out of service until the repair is complete. If the device is part of a dedup disk group, the entire disk group will be out of service until the repair is complete.
2022-05-31T11:42:46.065Z: [vSANCorrelator] 10606062774178us: [esx.problem.vob.vsan.lsom.devicerepair] Device 521a74ce-c980-c16c-ff3d-38a036233daf is in offline state and is getting repaired
/var/log/vsandevicemonitord.log
Se auttaa määrittämään, onko levy merkitty epäterveelliseksi lokien liiallisen ruuhkautumisen tai I/O-viiveiden vuoksi.
Esimerkki:
INFO vsandevicemonitord WARNING - WRITE Average Latency on VSAN device naa.50000xxxxxxxx has exceeded threshold value 2000000 us 2 times.
INFO vsandevicemonitord Tier 2 (naa.50000xxxxxxxx) as unhealthy