Håndtere kapasitetsproblemer i et Avamar-system
Når du håndterer kapasitetsproblemer i et Avamar-system, er det viktig å forstå hovedårsaken. Dette krever en rekke trinn, som starter med datainnsamling for grundig undersøkelse.
Avamar-systemer har flere typer kapasitetsgrenser. En omfattende forståelse av disse grensene, sammen med deres historiske kontekst, kan avklare både nåværende og tidligere kapasitetsproblemer som systemet opplever.
Systemet genererer bestemte hendelser, advarsler eller feil i brukergrensesnittet (UI) når bestemte kapasitetsterskler overskrides:
- 80%: Kapasitetsadvarsel
- 95%: Grensen for helsekontroll er nådd
- 100%: Grensen for skrivebeskyttelse for server er nådd, noe som fører til at rutenettet bytter til administratormodus
Når et Avamar-system er fullt, kan det oppstå følgende symptomer eller feil:
- Søppelinnsamling mislykkes, noe som resulterer i MSG_ERR_DISKFULL eller MSG_ERR_STRIPECREATE feil.
- Kontrollpunkter mislykkes på grunn av MSG_ERR_DISKFULL feil.
- Sikkerhetskopieringer kan ikke kjøres eller mislykkes på grunn av full kapasitet.
- Sikkerhetskopieringer mislykkes med MSG_ERR_STRIPECREATE feil eller meldinger som indikerer at målserveren er full.
- Tilgangstilstanden bytter til administratormodus (med mindre vedlikehold kjører).
- Sikkerhetskopieringsplanleggeren er deaktivert og kan ikke gjenopptas på grunn av kapasitetsgrenser for metadata.
Forståelse av disse aspektene kan hjelpe deg med å administrere og løse kapasitetsproblemer i et Avamar-system.
Innhenting av informasjon:
Logg på Avamar-serveren (Single-Node eller Utility Node), og kjør alle kommandoene. Disse samler bare inn informasjon og bruker ingen endringer:
1. Hvis den ikke allerede er kjent, gir den Avamar-serveren fullt navn eller fullstendig kvalifisert domenenavn (FQDN):
2. Kontroller at alle tjenester er aktivert, inkludert vedlikeholdsplanleggeren:
3. Den overordnede systemtilstanden:
4. Kjør kapasiteten
.SH-skript for å samle inn data for 60 dager og de 10 beste klientene:
capacity.sh --days=60 --top=10
5. Logger som viser grunnleggende atferd for innsamling av søppel i løpet av de siste 30 dagene:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. Mengden data som søppelsamlingen fjernet, hvor mange passeringer den fullførte og hvor lenge den løp.
For Avamar
v5.x og v6.x kjører du:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
For Avamar
v7.x og videre:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Sjekk hvor lenge hfscheck løper:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Detaljer om filsystem Kapasitetsbruk per node og per partisjon:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. En liste over tilgjengelige sjekkpunkter på systemet:
10. Planlagte start-/stopptider for vedlikeholdsjobb:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Samle alle diskinnstillinger:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Du må aldri endre verdier med mindre du får beskjed om det av en Avamar Subject Matter Expert (SME). Ikke-standardverdier kan være på plass av en god grunn. Forstå situasjonen grundig.
12. Samle inn antall forskjellige typer striper per node per datapartisjon:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Sjekk hvor mye minne (og bytt) som brukes på hver node: