解決 Avamar 系統中
的容量問題處理 Avamar 系統中的容量問題時,瞭解根本原因至關重要。這需要一系列步驟,從收集數據以進行徹底調查開始。
Avamar 系統有幾種類型的容量限制。全面了解這些限制及其歷史背景,可以澄清系統當前和過去遇到的容量問題。
超過特定容量閾值時,系統會在使用者介面 (UI) 中產生特定事件、警告或錯誤:
- 80%: 容量警告
- 95%: 已達到執行狀況檢查限制
- 100%: 已達到伺服器唯讀限制,導致格線切換至管理員模式
當 Avamar 系統已滿時,可能會出現下列症狀或錯誤:
- 垃圾收集失敗,導致MSG_ERR_DISKFULL或MSG_ERR_STRIPECREATE錯誤。
- 檢查點因MSG_ERR_DISKFULL錯誤而失敗。
- 由於容量已滿,備份無法執行或失敗。
- 備份失敗,並出現MSG_ERR_STRIPECREATE錯誤或訊息指出目標伺服器已滿。
- 存取狀態會切換為管理員模式 (除非維護正在執行中)。
- 備份排程器已停用,且由於中繼資料容量限制而無法恢復。
瞭解這些方面有助於管理和解決 Avamar 系統中的容量問題。
收集資訊:
登入 Avamar 伺服器 (單一節點或工具節點) 並執行所有命令。這些僅收集資訊,不會套用任何變更:
1.如果尚不知道,它會提供 Avamar 伺服器全名或完整網域名稱 (FQDN):
2.確認所有服務均已啟用,包括維護排程器:
3.整體系統狀態:
4.運行容量
。SH腳本收集60天的數據和前10名貢獻客戶:
capacity.sh --days=60 --top=10
5.顯示過去 30 天內基本垃圾收集行為的記錄:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6.垃圾回收刪除的數據量、完成的傳遞次數以及運行時間。
若為 Avamar
v5.x 和 v6.x,請執行:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
若為 Avamar
v7.x,請執行下列命令:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7.檢查 hfscheck 的執行時間:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8.每個節點和每個磁碟分割的檔案系統容量用量詳細資料:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9.系統上可用的檢查點清單:
10.維護工作排定開始/停止時間:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11.收集所有磁碟設定:
avmaint config --ava | egrep -i 'disk|crunching|balance'
除非經 Avamar 主題專家 (SME) 建議,否則切勿變更值。非預設值可能有充分的理由。徹底了解情況。
12.為每個資料分割區收集每個節點不同類型等量的計數:
avmaint nodelist --xmlperline=99 | grep 'comp='
13.檢查每個節點上正在使用的內存量 (和交換):