Hantera kapacitetsproblem i ett Avamar-system
När man hanterar kapacitetsproblem i ett Avamar-system är det viktigt att förstå grundorsaken. Detta kräver en serie steg, som börjar med datainsamling för grundlig undersökning.
Avamar-system har flera typer av kapacitetsbegränsningar. En omfattande förståelse av dessa gränser, tillsammans med deras historiska sammanhang, kan klargöra både nuvarande och tidigare kapacitetsproblem som systemet upplever.
Systemet genererar specifika händelser, varningar eller fel i användargränssnittet (UI) när vissa kapacitetströsklar överskrids:
- 80%: Kapacitetsvarning
- 95%: Gränsen för hälsokontroll har nåtts
- 100%: Serverns skrivskyddade gräns har nåtts, vilket gör att rutnätet växlar till administratörsläge
När ett Avamar-system är fullt kan det uppvisa följande symptom eller fel:
- Skräpinsamlingen misslyckas, vilket resulterar i MSG_ERR_DISKFULL eller MSG_ERR_STRIPECREATE fel.
- Kontrollpunkter misslyckas på grund av MSG_ERR_DISKFULL fel.
- Säkerhetskopieringar kan inte köras eller misslyckas på grund av full kapacitet.
- Säkerhetskopieringar misslyckas med MSG_ERR_STRIPECREATE fel eller meddelanden som anger att målservern är full.
- Åtkomsttillståndet växlar till administratörsläge (såvida inte underhåll körs).
- Schemaläggaren för säkerhetskopiering är inaktiverad och kan inte återupptas på grund av begränsningar i metadatakapaciteten.
Att förstå dessa aspekter kan hjälpa till att hantera och lösa kapacitetsproblem i ett Avamar-system.
Insamling av information:
Logga in på Avamar-servern (en nod eller verktygsnod) och kör alla kommandon. Dessa samlar endast in information och tillämpar inga ändringar:
1. Om den inte redan är känd innehåller den Avamar-serverns fullständiga namn eller fullständigt kvalificerade domännamn (FQDN):
2. Kontrollera att alla tjänster är aktiverade, inklusive underhållsschemaläggaren:
3. Det övergripande systemtillståndet:
4. Kör kapaciteten
.SH-skript för att samla in 60 dagars data och de 10 främsta bidragande klienterna:
capacity.sh --days=60 --top=10
5. Loggar som visar grundläggande skräpinsamlingsbeteende under de senaste 30 dagarna:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. Mängden data som skräpinsamlingen tog bort, hur många pass den slutfördes och hur länge den kördes.
För Avamar
v5.x och v6.x kör du:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
För Avamar
v7.x kör du:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Kontrollera hur länge hfscheck körs:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Information om filsystemets kapacitetsanvändning per nod och per partition:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. En lista över kontrollpunkter som är tillgängliga i systemet:
10. Underhållsjobbets schemalagda start-/stopptider:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Samla in alla diskinställningar:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Ändra aldrig värden om du inte fått råd av en Avamar-ämnesexpert (SME). Icke-standardvärden kan finnas på plats av en god anledning. Förstå situationen noggrant.
12. Samla in antal olika typer av stripes per nod per datapartition:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Kontrollera mängden minne (och växling) som används på varje nod: