Guía de solución de problemas de NetWorker: Bloqueos de procesos y volcados de memoria
Video: Guía completa de Dell NetWorker para solucionar bloqueos de procesos y volcados de núcleo
Ver en YouTube
Hay muchas razones diferentes por las que un proceso de NetWorker puede no responder. En este artículo, se describe el método recomendado para aislar y resolver un problema de falta de respuesta de un proceso de NetWorker.
Valide que cada paso de solución de problemas que aparece a continuación se pueda realizar en su entorno. En cada paso, se proporcionan instrucciones o un enlace a un documento para eliminar posibles causas y tomar medidas correctivas según sea necesario. Los pasos se ordenan en la secuencia más adecuada para aislar el problema e identificar la resolución adecuada. No omita ningún paso.
Paso 1: Recopilación de información: descripción del problema
Para generar una descripción completa del problema, responda las siguientes preguntas:
- ¿En qué circunstancias se bloquea el proceso? ¿Es coherente este comportamiento?
- ¿Funcionó mejor esto antes?
- Tiempos de instancias y tendencia
de comportamiento observado: ¿El problema ocurre solo en momentos de carga pesada en el entorno de respaldo o los respaldos, o un tipo particular de grupo de respaldo?
- ¿Cuándo se produjo el problema por primera vez? ¿Qué cambió entonces?
- Cuál es el alcance del problema (todos los clientes/algunos clientes, todos los objetivos de respaldo o algunos)
- Qué se ha intentado solucionar hasta ahora y qué conclusiones se han extraído de esto.
Paso 2: Recopilación de información: entorno
- Qué proceso de NetWorker no responde y en qué máquina (servidor, nodo de almacenamiento o cliente).
- Versión y plataforma
del servidor NetWorker - Descripción general del tamaño y la naturaleza de la zona
de datos de respaldo - Medios de destino para estas copias de seguridad
Paso 3: Compatibilidad
- Mediante la Guía de compatibilidad de NetWorker en línea, compruebe que todos los componentes (servidor de NetWorker, versión del sistema de archivos, proxy, nodos de almacenamiento, clientes y destino) sean compatibles.
- Compruebe que no haya ninguna deficiencia subyacente del sistema operativo o del hardware que pueda explicar los bloqueos del proceso (fallos de disco, disco lleno, errores de red, etc.).
Paso 4: Mejores prácticas
La Guía de planificación de la optimización del rendimiento de NetWorker contiene varias sugerencias de requisitos y recomendaciones de software y hardware que se deben implementar para tener un entorno de NetWorker optimizado de manera óptima. Esto se debe revisar para asegurarse de que se sigan las prácticas recomendadas para esta zona de datos. Esto es relevante si el proceso que no responde se produce en momentos de mayor carga.
Paso 5: Aislamiento de componentes
La forma en que encontramos la causa raíz del problema de falta de respuesta del proceso depende del comportamiento definido en el Paso 1. Si se desconoce el desencadenante, se pueden realizar pruebas para tratar de establecer qué es lo que está desencadenando el bloqueo:
- Monitorear el rendimiento del sistema bajo carga
pesada - Examinar los archivos de registro del sistema operativo alrededor del momento de los bloqueos para ver si el comportamiento
es común - Lea el programa de NetWorker para determinar si existe una correlación entre las horas de ocurrencia de una actividad programada de NetWorker en particular.
- Averigüe qué operaciones que no son de NetWorker que se ejecutan en esta máquina que podrían afectar su comportamiento y si su programación se correlaciona con los tiempos de los bloqueos.
- Si el bloqueo ocurre de manera constante, cambie algunos parámetros para tratar de reducir la causa. Por ejemplo, el respaldo en un medio de destino diferente o el respaldo de diferentes tipos de datos desde el mismo cliente de NetWorker
Paso 6: Solución
Un volcado de núcleo es un archivo especial que representa un volcado de la memoria de trabajo de un proceso en un momento específico, generalmente cuando el programa ha finalizado de manera anormal. Los archivos de volcado de memoria se pueden utilizar para diagnosticar el motivo por el cual un proceso no responde, mediante el análisis de qué funciones del proceso se estaban ejecutando en el momento del bloqueo y a qué datos se accedía.
La mayoría de los sistemas operativos no generan archivos de volcado de memoria automáticamente. Los parámetros del sistema operativo se deben modificar para que se genere un archivo de volcado de memoria en el momento de una falla del proceso. Esta modificación debe realizarse antes del accidente.
1) Compruebe el directorio /nsr/cores para ver los volcados de núcleo recientes de los procesos de NetWorker en Unix o Linux, o bien compruebe el directorio de bloqueos como se define en el registro de Windows (consulte el paso 2).
2) Si no hay ninguno, compruebe que el sistema operativo esté configurado para generar archivos de volcado de memoria en caso de que se produzca un bloqueo del proceso. Consulte la documentación del sistema operativo para obtener todos los detalles, pero en resumen, es probable que esto implique cambiar los valores -c y -f de ulimit en Linux o Unix y realizar un cambio en el registro en Windows.
Para Windows 2008R2:
- Actualice el registro con la nueva clave proporcionada en http://msdn.microsoft.com/en-us/library/bb787181(VS.85).aspx.
- Con los valores recomendados, el archivo de volcado se crea en C:\Users\Administrator\AppData\Local\CrashDumps- Enable full crash dumps
.
3) El archivo principal se puede examinar en la propia máquina host o se puede empaquetar para su análisis en otra máquina. Los detalles sobre cómo empaquetar estos archivos principales están disponibles aquí:
Empaquetado de archivos principales de UNIX y Linux:
489272: Cómo recolectar información de volcado de memoria/principal y registros
relacionadosPara Windows, siga las instrucciones que se indican aquí:
198564: Cómo recopilar el kernel y el volcado de usuario para procesos suspendidos en Windows
4) Analice los datos disponibles:
- Archivos
de registro del sistema operativo- Archivo de registro del demonio de NetWorker desde NetWorker Server y el nodo de almacenamiento pertinente.
- Archivo de núcleo o archivo
de bloqueo El análisis detallado de un archivo de núcleo requiere un conocimiento avanzado de las operaciones internas de NetWorker y debe ser realizado por el soporte de EMC NetWorker. Sin embargo, se puede realizar una lectura inicial del archivo de núcleo para comparar el contenido del archivo de núcleo con problemas conocidos.
Linux y HP-UX
gdb [ruta completa al proceso] [archivo principal]
(gdb) donde
AIX
dbx [ruta completa al proceso] [archivo principal]
(dbx) donde
Solaris
pstack [archivo principal ]
dbx [ruta completa al proceso] [archivo principal]
(dbx) donde
Windows
- Inicie el programa
depurador de windows windbg- Haga clic en Archivo y abra el archivo de volcado en windbg.
- Escriba analyze --v en la ventana de comandos inferior para recuperar la información completa.
5) Según el análisis anterior y el conocimiento sobre el comportamiento del sistema, puede comparar el incidente con la lista de problemas conocidos que se detalla en las Notas de la versión de NetWorker para la versión más reciente.
Paso 7: Depuración avanzada (si es necesario)
Si sospecha que hay una falla en el software NetWorker responsable de que el proceso no responda, debe empaquetar el archivo de bloqueo (consulte el paso 3) y proporcionar una descripción completa del comportamiento observado al soporte de NetWorker de Dell Technologies para obtener un análisis detallado del problema.