Rozwiązywanie problemów z pojemnością w systemie
AvamarW przypadku problemów z pojemnością systemu Avamar kluczowe znaczenie ma zrozumienie ich pierwotnej przyczyny. Wymaga to szeregu kroków, począwszy od zebrania danych w celu dokładnego zbadania.
Systemy Avamar mają kilka rodzajów limitów pojemności. Kompleksowe zrozumienie tych limitów, wraz z ich kontekstem historycznym, może wyjaśnić zarówno obecne, jak i przeszłe problemy z przepustowością, których doświadcza system.
System generuje określone zdarzenia, ostrzeżenia lub błędy w interfejsie użytkownika (UI) po przekroczeniu określonych progów pojemności:
- 80%: Ostrzeżenie o pojemności
- 95%: Osiągnięto limit kontroli poprawności działania
- 100%: Osiągnięto limit tylko do odczytu serwera, co powoduje przełączenie sieci w tryb administratora
Gdy system Avamar jest pełny, mogą wykazywać następujące objawy lub błędy:
- Odzyskiwanie pamięci kończy się niepowodzeniem, co powoduje błędy MSG_ERR_DISKFULL lub MSG_ERR_STRIPECREATE.
- Punkty kontrolne kończą się niepowodzeniem z powodu MSG_ERR_DISKFULL błędu.
- Tworzenie kopii zapasowych nie może działać lub kończyć się niepowodzeniem z powodu pełnej pojemności.
- Tworzenie kopii zapasowych kończy się niepowodzeniem z powodu MSG_ERR_STRIPECREATE błędów lub komunikatów wskazujących, że serwer docelowy jest pełny.
- Stan dostępu przełącza się w tryb administratora (chyba że uruchomiono konserwację).
- Harmonogram tworzenia kopii zapasowych jest wyłączony i nie można go wznowić ze względu na ograniczenia pojemności metadanych.
Zrozumienie tych aspektów może pomóc w zarządzaniu i rozwiązywaniu problemów z pojemnością w systemie Avamar.
Zbieranie informacji:
Zaloguj się do serwera Avamar (pojedynczy węzeł lub węzeł mediów) i uruchom wszystkie polecenia. Gromadzą one jedynie informacje i nie wprowadzają żadnych zmian:
1. Jeśli nie jest jeszcze znana, podaje pełną nazwę serwera Avamar lub w pełni kwalifikowaną nazwę domeny (FQDN):
2. Sprawdź, czy wszystkie usługi są włączone, w tym harmonogram konserwacji:
3. Ogólny stan systemu:
4. Uruchom pojemność
.sh do zbierania danych z 60 dni i 10 klientów z największym wkładem:
capacity.sh --days=60 --top=10
5. Dzienniki przedstawiające podstawowe zachowanie związane z wyrzucaniem elementów bezużytecznych w ciągu ostatnich 30 dni:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. Ilość danych, które zostały usunięte z wyrzucania elementów bezużytecznych, liczba ukończonych przebiegów i czas działania.
W przypadku Avamar
v5.x i v6.x uruchom polecenie:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
W przypadku Avamar
7.x, uruchom następnie:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Sprawdź, jak długo działa narzędzie hfscheck:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Szczegółowe informacje o wykorzystaniu pojemności systemu plików na węzeł i partycję:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. Lista punktów kontrolnych dostępnych w systemie:
10. Zaplanowane godziny rozpoczęcia/zakończenia zadania konserwacji:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Zbierz wszystkie ustawienia dysku:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Nigdy nie zmieniaj wartości, chyba że zaleci to ekspert Avamar Subject Matter Expert (SME). Wartości inne niż domyślne mogą być stosowane nie bez powodu. Dokładnie zrozum sytuację.
12. Zbieraj liczby różnych typów przeplotów na węzeł na partycję danych:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Sprawdź ilość pamięci (i wymiany) używanej w każdym węźle: