Solución de problemas de capacidad en un sistema
AvamarCuando se trata de problemas de capacidad en un sistema Avamar, es fundamental comprender la causa raíz. Esto requiere una serie de pasos, comenzando con la recolección de datos para una investigación exhaustiva.
Los sistemas Avamar tienen varios tipos de límites de capacidad. Una comprensión integral de estos límites, junto con su contexto histórico, puede aclarar los problemas de capacidad actuales y pasados experimentados por el sistema.
El sistema genera eventos, advertencias o errores específicos en la interfaz de usuario (IU) cuando se superan ciertos umbrales de capacidad:
- 80%: Advertencia de capacidad
- 95%: Se alcanzó el límite de evaluación del estado
- 100%: Se alcanzó el límite de solo lectura del servidor, lo que provoca que la cuadrícula cambie al modo de administrador
Cuando un sistema Avamar está lleno, puede presentar los siguientes síntomas o errores:
- La recolección de elementos no utilizados falla, lo que genera errores de MSG_ERR_DISKFULL o MSG_ERR_STRIPECREATE.
- Los puntos de control fallan debido a MSG_ERR_DISKFULL error.
- Los respaldos no pueden ejecutarse o fallan debido a la capacidad completa.
- Los respaldos fallan con MSG_ERR_STRIPECREATE errores o mensajes que indican que el servidor de destino está lleno.
- El estado de acceso cambia al modo de administrador (a menos que el mantenimiento esté en ejecución).
- El programador de respaldo está deshabilitado y no se puede reanudar debido a los límites de capacidad de metadatos.
Comprender estos aspectos puede ayudar a administrar y resolver problemas de capacidad en un sistema Avamar.
Recopilación de información:
Inicie sesión en el servidor Avamar (nodo de utilidad o nodo único) y ejecute todos los comandos. Estos solo recopilan información y no aplican ningún cambio:
1. Si aún no se conoce, proporciona el nombre completo o el nombre de dominio completo (FQDN) del servidor Avamar:
2. Verifique que todos los servicios estén habilitados, incluido el programador de mantenimiento:
3. El estado general del sistema:
4. Ejecute la capacidad
.SH para recopilar 60 días de datos y los 10 principales clientes contribuyentes:
capacity.sh --days=60 --top=10
5. Registros que muestran el comportamiento básico de la recolección de elementos no utilizados en los últimos 30 días:
dumpmaintlogs --types=gc --days=30 | grep "4202"
6. La cantidad de datos que la recolección de elementos no utilizados eliminó, cuántos pases completó y durante cuánto tiempo se ejecutó.
Para Avamar
v5.x y v6.x, ejecute lo siguiente:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,12,13,15
Para Avamar
v7.x, en adelante, ejecute lo siguiente:
dumpmaintlogs --types=gc --days=30 | grep passes | cut -d ' ' -f1,10,14,15,17
7. Compruebe cuánto tiempo dura hfscheck:
dumpmaintlogs --types=hfscheck --days=30 | grep -i elapsed|cut -d ' ' -f1,12 | grep -v check
8. Detalles del uso de la capacidad del sistema de archivos por nodo y por partición:
avmaint nodelist | egrep 'nodetag|fs-percent-full'
9. Una lista de puntos de control disponibles en el sistema:
10. Horas de inicio/detención programadas del trabajo de mantenimiento:
avmaint sched status --ava | egrep -A 2 "maintenance-window|backup-window" | tail -16
11. Recopile todos los ajustes de disco:
avmaint config --ava | egrep -i 'disk|crunching|balance'
Nunca cambie los valores, a menos que se lo indique un experto en la materia (SME) de Avamar. Es posible que existan valores no predeterminados por una buena razón. Comprenda bien la situación.
12. Recopile conteos de diferentes tipos de fracciones por nodo por partición de datos:
avmaint nodelist --xmlperline=99 | grep 'comp='
13. Compruebe la cantidad de memoria (e intercambio) en uso en cada nodo: