Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Create and access a list of your products

Guia de solução de problemas do NetWorker: Falhas de processo e core dumps

Summary: Guia abrangente do Dell NetWorker para solução de problemas de falhas de processo e dumps de núcleo

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Guia de solução de problemas do NetWorker: Falhas de processo e core dumps

Vídeo: Guia abrangente do Dell NetWorker para solução de problemas de falhas de processo e dumps de núcleo

Assista no YouTubeEsse hiperlink direcionará você para um site fora da Dell Technologies.

Cause

Há muitos motivos diferentes pelos quais um processo do NetWorker pode não responder. Este artigo define o método recomendado para isolar e resolver um problema em que o processo do NetWorker não responde.

Resolution

Confirme se cada etapa de solução de problemas abaixo é verdadeira para seu ambiente. Cada etapa fornece instruções ou um link para um documento a fim de eliminar possíveis causas e tomar ações corretivas conforme necessário. As etapas são ordenadas na sequência mais apropriada para isolar o problema e identificar a resolução adequada. Não ignore uma etapa.

Passo 1: Coletando informações - Descrição do problema
Para gerar uma descrição completa do problema, responda às seguintes perguntas:
    - Em que circunstâncias o processo falha. Esse comportamento é consistente?
    - Fiz isso melhor antes.
    - Tempos de ocorrências e tendência
de comportamento observado — o problema acontece apenas em momentos de carga pesada no ambiente de backup ou backups ou em um tipo específico de grupo de backup.
    - Quando o problema ocorreu pela primeira vez. O que mudou então?
    - Qual é o escopo do problema (todos os clientes/alguns clientes, todos os alvos de backup ou alguns)
- O que foi tentado até agora corrigir e quais conclusões foram tiradas disso.

Etapa 2: Coleta de informações - Ambiente
     - Qual processo do NetWorker está sem responder e em qual máquina (servidor, nó de armazenamento ou client).
     - Versão e plataforma
do servidor NetWorker - Visão geral do tamanho e da natureza da zona
de dados de backup - Mídia de destino para esses backups

Etapa 3: Suporte
      - Usando o Guia de compatibilidade on-line do NetWorker, verifique se todos os componentes (servidor NetWorker, versão do file system, proxy, nós de armazenamento, clients, destino) são compatíveis.
      - Verifique se não há nenhum sistema operacional subjacente ou deficiência de hardware que explicaria as falhas do processo (falhas de disco, disco cheio, erros de rede e assim por diante).

Etapa 4: Práticas recomendadas
      O Guia de planejamento de otimização de desempenho do NetWorker contém várias sugestões de requisitos e recomendações de software e hardware que devem ser implementadas para ter um ambiente do NetWorker ajustado de forma ideal. Isso deve ser revisto para garantir que as práticas recomendadas estejam sendo seguidas para essa zona de dados. Isso é relevante se o processo que está sem resposta estiver acontecendo em momentos de carga mais pesada.

Etapa 5: Isolamento de componentes
       Como vamos encontrar a causa raiz do problema de processo não responder depende do comportamento definido na Etapa 1. Se o gatilho for desconhecido, testes podem ser realizados para tentar estabelecer o que está causando a falha:

    - Monitore o desempenho do sistema sob carga
pesada - Examine os arquivos de log do sistema operacional na época das falhas para ver se há um comportamento
comum - Leia o agendamento do NetWorker para determinar se há uma correlação entre os horários de ocorrência de uma determinada atividade agendada do NetWorker.
    - Descubra quais operações não-NetWorker são executadas nesta máquina que podem afetar seu comportamento e se sua programação está correlacionada com os tempos de falhas.
    - Se a falha ocorrer de forma consistente, altere alguns parâmetros para tentar restringir a causa.  Por exemplo, fazer backup em uma mídia de destino diferente ou fazer backup de diferentes tipos de dados a partir do mesmo client do NetWorker

Etapa 6: Resolução
Um coredump é um arquivo especial que representa um dump da memória de trabalho de um processo em um momento específico, geralmente quando o programa foi encerrado de forma anormal.  Os arquivos core dump podem ser usados para diagnosticar o motivo de um processo não responder, analisando quais funções do processo estavam em execução no momento da falha e quais dados estavam sendo acessados.

A maioria dos sistemas operacionais não gera arquivos core dump automaticamente.  Os parâmetros do sistema operacional devem ser modificados para que um dump file principal seja gerado no momento da falha do processo.  Essa modificação deve ser feita antes da falha.

1) Verifique o diretório /nsr/cores para ver se há dumps de núcleo recentes de processos do NetWorker no unix ou linux ou verifique o diretório de falha conforme definido no registro do Windows (consulte a etapa 2).

2) Se não houver nenhum, verifique se o sistema operacional está configurado para gerar dump files principais se houver uma falha no processo.  Consulte a documentação do sistema operacional para obter detalhes completos. Em resumo, isso provavelmente envolverá a alteração dos valores ulimit -c e -f no Linux ou Unix e fazer uma alteração de registro no Windows.

Para Windows 2008R2:  
- Atualize o registro com a nova chave fornecida em http://msdn.microsoft.com/en-us/library/bb787181(VS.85).aspx.
- Usando os valores recomendados, o dump file é criado em C:\Users\Administrator\AppData\Local\CrashDumps
- Habilite despejos de memória completos.

3) O arquivo de núcleo pode ser examinado na própria máquina host ou pode ser empacotado para análise em outra máquina.  Os detalhes de como empacotar esses arquivos principais estão disponíveis aqui:

UNIX and Linux core file packaging:
489272: Como coletar informações de core dump e logs

relacionadosPara Windows, siga as instruções a seguir:
198564: Como coletar o kernel e o despejo de usuário para o(s) processo(s) travado(s) no Windows          

4) Analise os dados disponíveis:

- Arquivos
de log do sistema operacional- Arquivo de log do daemon do NetWorker do servidor do NetWorker e do nó de armazenamento relevante.  
- Arquivo principal ou arquivo

de travamento: a análise detalhada de um arquivo principal requer um conhecimento avançado das operações internas do NetWorker e deve ser feita pelo suporte do EMC NetWorker.  No entanto, uma leitura inicial do arquivo de núcleo pode ser feita para comparar o conteúdo do arquivo de núcleo com problemas conhecidos.

Linux e HP-UX
gdb [full path to process] [core file]
(gdb) onde

AIX
dbx [full path to process] [core file]
(dbx) onde

Solaris
pstack [ core file ]
dbx [full path to process] [core file]
(dbx) where

Windows
- Start the windbg windows debugger program
- Click on File and Open Dump File in windbg.
- Digite analyze --v na janela de comando inferior para recuperar informações completas.
    
5) Com base na análise acima e no conhecimento sobre o comportamento do sistema, você pode comparar o incidente com a lista de problemas conhecidos detalhados nas Notas da versão do NetWorker para a versão mais recente.

Etapa 7: Depuração avançada (se necessário)
Se você suspeitar que há uma falha no software NetWorker responsável por o processo não responder, empacote o arquivo de falha (consulte a etapa 3) e forneça-o com uma descrição completa do comportamento observado ao suporte do NetWorker da Dell Technologies para obter uma análise detalhada do problema.

Affected Products

NetWorker

Products

NetWorker
Article Properties
Article Number: 000034716
Article Type: Solution
Last Modified: 23 Sept 2024
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.