Addressing capacity issues in an Avamar system
Bij het omgaan met capaciteitsproblemen in een Avamar-systeem is het cruciaal om de hoofdoorzaak te begrijpen. Dit vereist een reeks stappen, te beginnen met het verzamelen van gegevens voor grondig onderzoek.
Avamar-systemen hebben verschillende soorten capaciteitslimieten. Een uitgebreid begrip van deze limieten, samen met hun historische context, kan zowel de huidige als de vroegere capaciteitsproblemen van het systeem verduidelijken.
Het systeem genereert specifieke gebeurtenissen, waarschuwingen of fouten in de gebruikersinterface (UI) wanneer bepaalde capaciteitsdrempels worden overschreden:
- 80%: Capaciteitswaarschuwing
- 95%: De limiet voor statuscontrole is bereikt
- 100%: De limiet voor alleen-lezen van de server is bereikt, waardoor het raster overschakelt naar de beheermodus
Wanneer een Avamar-systeem vol is, kan het de volgende symptomen of fouten vertonen:
- Garbage collection mislukt, wat resulteert in MSG_ERR_DISKFULL of MSG_ERR_STRIPECREATE fouten.
- Controlepunten mislukken door MSG_ERR_DISKFULL fout.
- Back-ups kunnen niet worden uitgevoerd of mislukken vanwege de volledige capaciteit.
- Back-ups mislukken met MSG_ERR_STRIPECREATE-fouten of berichten die aangeven dat de doelserver vol is.
- De toegangsstatus schakelt over naar de beheermodus (tenzij onderhoud wordt uitgevoerd).
- De back-upplanner is uitgeschakeld en kan niet worden hervat vanwege capaciteitslimieten voor metadata.
Inzicht in deze aspecten kan helpen bij het beheren en oplossen van capaciteitsproblemen in een Avamar-systeem.
Informatie verzamelen:
Meld u aan bij de Avamar-server (enkel knooppunt of hulpprogrammaknooppunt) en voer alle opdrachten uit. Deze verzamelen alleen informatie en passen geen wijzigingen toe:
1. Als deze nog niet bekend is, bevat deze de volledige naam of Fully Qualified Domain Name (FQDN) van de Avamar-server:
2. Controleer of alle services zijn ingeschakeld, inclusief de onderhoudsplanner:
3. De algehele systeemstatus:
4. Voer de capaciteit
uit.SH-script om 60 dagen aan gegevens en de top 10 bijdragende klanten te verzamelen:
capacity.sh --days=60 --top=10
5. Logboeken met basisgedrag van garbage collection in de afgelopen 30 dagen:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. De hoeveelheid data die garbage collection heeft verwijderd, hoeveel passes deze heeft voltooid en hoe lang deze is uitgevoerd.
Voor Avamar
v5.x en v6.x voert u de volgende opdracht uit:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
Voor Avamar
v7.x voert u de volgende stappen uit:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Controleer hoe lang hfscheck wordt uitgevoerd:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Details van het capaciteitsgebruik van het bestandssysteem per knooppunt en per partitie:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. Een lijst met controlepunten die beschikbaar zijn op het systeem:
10. Geplande start/stoptijden voor onderhoudstaken:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Verzamel alle schijfinstellingen:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Verander nooit waarden tenzij geadviseerd door een Avamar Subject Matter Expert (SME). Niet-standaardwaarden kunnen om een goede reden aanwezig zijn. Begrijp de situatie grondig.
12. Verzamel tellingen van verschillende soorten strepen per knooppunt per gegevenspartitie:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Controleer de hoeveelheid geheugen (en swap) die op elk knooppunt wordt gebruikt: