Håndtering af kapacitetsproblemer i et Avamar-system
Når du håndterer kapacitetsproblemer i et Avamar-system, er det afgørende at forstå den grundlæggende årsag. Dette kræver en række trin, der starter med dataindsamling til grundig undersøgelse.
Avamar-systemer har flere typer kapacitetsgrænser. En omfattende forståelse af disse grænser sammen med deres historiske kontekst kan afklare både nuværende og tidligere kapacitetsproblemer, som systemet oplever.
Systemet genererer specifikke hændelser, advarsler eller fejl i brugergrænsefladen, når visse kapacitetsgrænser overskrides:
- 80%: Kapacitetsadvarsel
- 95%: Grænsen for sundhedstjek er nået
- 100%: Serverens skrivebeskyttede grænse nås, hvilket får gitteret til at skifte til administratortilstand
Når et Avamar-system er fuldt, kan det udvise følgende symptomer eller fejl:
- Indsamling af affald mislykkes, hvilket resulterer i MSG_ERR_DISKFULL eller MSG_ERR_STRIPECREATE fejl.
- Kontrolpunkter mislykkes på grund af MSG_ERR_DISKFULL fejl.
- Sikkerhedskopieringer kan ikke køre eller mislykkes på grund af fuld kapacitet.
- Sikkerhedskopieringer mislykkes med MSG_ERR_STRIPECREATE fejl eller meddelelser, der angiver, at destinationsserveren er fuld.
- Adgangstilstanden skifter til administratortilstand (medmindre vedligeholdelsen kører).
- Sikkerhedskopieringsprogrammet er deaktiveret og kan ikke genoptages pga. begrænsninger i metadatakapaciteten.
En forståelse af disse aspekter kan hjælpe med at administrere og løse kapacitetsproblemer i et Avamar-system.
Indsamling af oplysninger:
Log på Avamar-serveren (Single Node eller Utility Node), og kør alle kommandoer. Disse indsamler kun oplysninger og anvender ingen ændringer:
1. Hvis den ikke allerede er kendt, angives Avamar-serverens fulde navn eller fulde domænenavn (FQDN):
2. Kontrollér, at alle services er aktiveret, herunder maintenance scheduler:
3. Det overordnede system angiver:
4. Kør kapaciteten
.SH-script til indsamling af 60 dages data og de 10 bedste bidragende kunder:
capacity.sh --days=60 --top=10
5. Logfiler, der viser grundlæggende adfærd for affaldsindsamling i løbet af de sidste 30 dage:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. Mængden af data, som affaldssamlingen fjernede, hvor mange passager den gennemførte, og hvor længe den kørte.
For Avamar
v5.x og v6.x skal du køre:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
For Avamar
v7.x skal du køre:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Kontroller, hvor længe hfscheck kører:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Oplysninger om filsystemets kapacitetsforbrug pr. node og pr. partition:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. En liste over kontrolpunkter, der er tilgængelige på systemet:
10. Planlagte start-/stoptidspunkter for vedligeholdelsesjob:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Indsaml alle diskindstillinger:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Du må aldrig ændre værdier, medmindre du er anbefalet af en Avamar Subject Matter Expert (SME). Der kan være en god grund til, at ikke-standardværdier er på plads. Forstå situationen grundigt.
12. Indsaml antal forskellige typer striber pr. node pr. datapartition:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Kontrollér mængden af hukommelse (og swap), der er i brug på hver node: