Вирішення проблем з пропускною здатністю в системі
AvamarМаючи справу з проблемами ємності в системі Avamar, дуже важливо розуміти першопричину. Це вимагає низки кроків, починаючи зі збору даних для ретельного розслідування.
Системи Avamar мають кілька типів обмежень потужності. Всебічне розуміння цих обмежень разом з їх історичним контекстом може прояснити як поточні, так і минулі проблеми спроможності, з якими стикається система.
Система генерує певні події, попередження або помилки в інтерфейсі користувача (UI) при перетині певних порогових значень потужності:
- 80%: Попередження про ємність
- 95%: Ліміт перевірки здоров'я досягнуто
- 100%: Досягнуто ліміту лише читання сервера, що призводить до переходу сітки в режим адміністратора
Коли система Avamar заповнена, у неї можуть проявлятися такі симптоми або помилки:
- Збір сміття не працює, що призводить до помилок MSG_ERR_DISKFULL або MSG_ERR_STRIPECREATE.
- Через MSG_ERR_DISKFULL помилку КПП виходять з ладу.
- Резервне копіювання не може запуститися або вийти з ладу через повну потужність.
- Резервне копіювання завершується невдалим MSG_ERR_STRIPECREATE помилками або повідомленнями, які вказують на те, що цільовий сервер заповнений.
- Стан доступу переходить у режим адміністратора (якщо не виконується технічне обслуговування).
- Планувальник резервного копіювання вимкнено, і його не можна відновити через обмеження місткості метаданих.
Розуміння цих аспектів може допомогти в управлінні та вирішенні проблем з пропускною спроможністю в системі Avamar.
Збір інформації:
Увійдіть на сервер Avamar (Single-Node або Utility Node) і виконайте всі команди. Вони лише збирають інформацію та не застосовують жодних змін:
1. Якщо він ще не відомий, він надає повне ім'я сервера Avamar або повне доменне ім'я (FQDN):
2. Переконайтеся, що ввімкнено всі служби, включно з планувальником обслуговування.
3. Загальний стан системи:
4. Запустіть ємність
.sh скрипт для збору даних за 60 днів і топ-10 клієнтів, що беруть участь:
capacity.sh --days=60 --top=10
5. Журнали, що показують базову поведінку збирання сміття за останні 30 днів:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. Кількість даних, які видалило збір сміття, скільки проходів він виконав і як довго працював.
Для Avamar
v5.x і v6.x запустіть:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
Для Avamar
v7.x далі запустіть:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Перевірте, скільки часу працює hfscheck:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Подробиці про файлову систему Використання ємності на вузол і на розділ:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. Перелік контрольно-пропускних пунктів, доступних у системі:
10. Запланований час запуску/зупинки робіт з технічного обслуговування:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Зберіть всі налаштування диска:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Ніколи не змінюйте значення, якщо це не рекомендовано експертом Avamar з предметних питань (SME). Значення за замовчуванням можуть існувати з поважної причини. Розберіться в ситуації досконально.
12. Збирайте кількість різних типів страйпів для кожного вузла на розділ даних:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Перевірте обсяг пам'яті (і підкачки), що використовується на кожному вузлі: