Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Metro Node: Como coletar logs do nó metro

Summary: Este artigo descreve as etapas sobre como coletar logs do Metro Node e também aborda quais logs/dados podem ser necessários para um problema de desempenho.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Instructions

Etapas sobre como realizar as seguintes tarefas: 

  1. Quais logs são necessários para depurar problemas do nó metro? 
  2. Como capturar o collect-diagnostics em um cluster do Metro Node? 
  3. Como validar os pacotes existentes de coleta de diagnóstico nos servidores de gerenciamento.  
  4. Como cancelar e limpar um diagnóstico de coleta contínuo no Metro Node?  


Nota: Se os registros do SupportAssist forem necessários, encaminhe o cliente para o 000135669 KBA: "Como exportar uma coleta de logs do SupportAssist do SupportAssist Enterprise? Conectado ou desconectado "


 A. Quais logs são necessários para depurar problemas do nó metro? 

  1. O comando necessário para coletar logs do Metro Node é chamado de "collect-diagnostics" e pode ser executado a partir de qualquer nó[1] na configuração do Metro Node. A execução desse comando em um director de um cluster do metro node deve ter todos os dados de todos os directors, de todos os nós de um cluster. NÃO execute esse comando em mais de um nó por vez.

 

[1] NOTA: Execute o comando "collect-diagnostics" de apenas um director, em apenas um cluster se uma configuração do Metro e aguarde a conclusão completa antes de coletar os CDs de outro director ou do cluster par, se necessário. 
 
  1. O comando 'collect-diagnostics' produz um arquivo de log tar.gz compactado que contém arquivos de configuração e de log. O arquivo collect-diagnostics é colocado no diretório /diag/collect-diagnostics-out/ no nó a partir do qual ele foi executado. Quando o comando for concluído, use WINSCP, ou um utilitário SCP equivalente, para copiar o arquivo do nó e, em seguida, ele poderá ser fornecido ao suporte para análise. Há mais informações sobre o uso desse comando na seção B abaixo.

 

Notas: 

  • Se o comando 'collect-diagnostics' for executado sem opções, dois arquivos serão gerados: um de base e um estendido. Isso pode levar bastante tempo em sistemas dimensionados. 
  • O suporte ao nó metro geralmente requer apenas o arquivo base. No entanto, em algumas circunstâncias, problemas de desempenho eles podem solicitar o arquivo estendido também. 
  • As opções padrão que podem ser solicitadas para serem usadas ao executar o collect-diagnostics são: 

 

    "--noextended", esta opção omite a coleta de diagnósticos estendidos. 
    "--last-logs", essa opção captura logs de volta x número de horas ou dias. 

 

  • Para obter mais detalhes sobre o comando, digite "collect-diagnostics -h

 

Estes são exemplos da aparência desses dois nomes de arquivo. A data e a hora, mostradas como YYYY-MM-DD-HH.MM.SS, serão a partir da data e hora em que foram coletadas: 

 

  • Arquivo de base - <Número> de série-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz 
  • Arquivo estendido - <Número> de série-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz 

        

  1. Os problemas de desempenho são complexos e exigem a coleta de muitas informações específicas. Como resultado, temos um questionário de desempenho que os clientes devem preencher para agilizar esse processo. O questionário pode ser encontrado anexado a este artigo da base de conhecimento na seção anexa no final. 

 

  1. Em alguns tipos de problemas de desempenho, é útil capturar um registro adicional chamado "fe_perf_stats". Os logs são gerados continuamente, mas não capturados pelo collect-diagnostics. Para capturar esse log, use cd (change directory) em /var/log/VPlex/cli em um nó de cada cluster e execute o comando "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" para compactar os dados dos arquivos em um arquivo tar. Conecte-se ao nó com WINSCP, ou um utilitário SCP equivalente, e navegue até /var/log/VPlex/cli. Copie o arquivo "fe-perf-stats.tar.gz" para o sistema. Carregue o arquivo tar junto com os arquivos collect-diagnostics, se solicitado pelo suporte, para o SR ou um link ftp que o suporte fornecerá a você no SR e em um e-mail. 

  

  1. Além de coletar diagnósticos, pode ser útil capturar as seguintes informações;
  • Abra o log para uma sessão do PuTTY,
  • em seguida, execute os comandos abaixo,
  • em seguida, colete o log do Putty e faça o download para o seu sistema,
  • em seguida, anexe o log PuTTY,
    o collect-diagnostics e quaisquer outros dados solicitados ao SR.

 

Os comandos a seguir devem ser executados no prompt VPlexcli.  

 

  1. Status do cluster 
  2. Clusters LL/**/storage-views/* --full 
  3. LL ~Portas 
  4. show-use-hierarchy /clusters/**/virtual-volumes/* 
  5. LL ~Volumes do sistema 
  6. ls -t /clusters/*/directors/*::serial-number [este comando listará todos os DSTs de cada nó]
  7. ls -t /clusters/**/director-*/::hostname [os nomes de host exibidos serão os endereços IP, isso é esperado]

  

B. Como capturar o collect-diagnostics em um cluster do Metro Node? 
 
Nota: O arquivo base, que abrange os últimos 30 dias, é suficiente para investigar e resolver a maioria dos problemas. Essas opções devem ser usadas, a menos que instruído de outra forma pelo suporte.
Para capturar esses dados, execute um comando collect-diagnostics com os seguintes indicadores: "--noextended" e "--last-logs 30d".

 

  1. Estabeleça uma sessão SSH em um prompt Linux do nó director, por exemplo, service@director-1-1-a, e faça log-in na vplexcli. 

 

Exemplo de resultado:

login as: service 
Keyboard-interactive authentication prompts from server: 
| Password: 
End of keyboard-interactive prompts from server 
Last login: <date and timestamp data> from x.x.x.x
service@director-1-1-a:~> 
service@director-1-1-a:~> vplexcli 
Trying ::1... 
Connected to localhost. 
Escape character is '^]'. 
 
VPlexcli:/> 

 

  1. Para iniciar o collect-diagnostics, no prompt vplexcli, execute o comando "collect-diagnostics" com as opções direcionadas, conforme mostrado no exemplo abaixo. 

 

Exemplo de resultado: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2024-02-09 19:55:13 UTC: No cluster-witness server found. 
2024-02-09 19:55:13 UTC: Free space = 88G 
2024-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection .. 

 

C. Como validar os pacotes collect-diagnostics existentes no director/nó. 

 

  1. Quando o comando collect-diagnostics for concluído e retornar ao prompt vplexcli, conecte-se ao diretório no qual você executou o comando usando winscp [ou utilitário SCP equivalente] e navegue até a pasta /diag/collect-diagnostics-out/ 

 

  1. Identifique os arquivos de log com o registro correto de data/hora e faça download deles em sua workstation local. 

 

D. Como abortar um diagnóstico

de coleta contínuoNota:  Esta é uma atividade não disruptiva. Como não há comandos diretos para anular o processo de coleta, será necessário reiniciar o console de gerenciamento. No entanto, antes de abortar um collect-diagnostics em execução, entre em contato com o suporte para explicar por que você deseja abortar a execução do collect-diagnostics para garantir que esteja OK, pois pode haver dados que podem ser perdidos. Esses dados perdidos não estarão disponíveis para coleta novamente quando os diagnósticos de coleta forem executados novamente após a ação de anulação.

 

  1. Se você ainda estiver na sessão PuTTY em que iniciou o collect-diagnostics, deverá ver o fluxo de saída collect-diagnostics, mostrando que ele ainda está em execução. 

 

Exemplo de resultado: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2022-02-09 19:55:13 UTC: No cluster-witness server found. 
2022-02-09 19:55:13 UTC: Free space = 88G 
2022-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection .. 

  

  1. Abra uma sessão PuTTY duplicada e faça log-in no diretório em que você iniciou o collect-diagnostics usando a conta de serviço. 

 

  Exemplo de resultado: 

login as: service 
Using keyboard-interactive authentication. 
Password: 
Last login: <date and time stamp data> from x.x.x.x 
service@director-1-1-b:~>

 

  1. Uma vez no director, reinicie o console de gerenciamento usando o seguinte comando para abortar o collect-diagnostics que está em execução.  

 

Exemplo de resultado: 

   service@director-1-1-b:~> sudo systemctl reiniciar VPlexManagementConsole.service 
 

  1. Olhando para a primeira sessão do PuTTY que tem o collect-diagnostics em execução nela quando você reiniciou o console de gerenciamento, você deve ver o relatório collect-diagnostics como a última saída anotada: 

 

"Connection closed by foreign host."

 

Exemplo de resultado (verifique a última linha do resultado):

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
2022-02-09 20:02:04 UTC: No cluster-witness server found. 
2022-02-09 20:02:04 UTC: Free space = 88G 
2022-02-09 20:02:04 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..                               ERROR 
Executing SMS log collection ..                               Connection closed by foreign host. <<<

 

  1. Uma vez que o collect-diagnostics for visto interrompido, etapa 3 acima, volte para a segunda sessão PuTTY e 'cd' para o diretório /diag, em seguida, execute ' ll ' e você deve ver alguns diretórios extras, 

 

  • coleta-diagnóstico-tmp
  • collect-diagnostics-jobs 
  • collect-diagnostics-tmp-ext*

      *se os arquivos estendidos não foram omitidos

 

Exemplo de resultado: 

service@director-1-1-b:/diag> ll 
total 32 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag> 

 

  1. Se você olhar dentro de cada um desses diretórios, verá arquivos com a data e a hora em que iniciou o diagnóstico de coleta agora cancelado. Esses arquivos ocupam espaço na partição /diag e devem ser removidos. 

 

  1. Para remover/excluir os arquivos do diretório /diag, digite "rm -r collect-diagnostics-jobs" e "rm -r collect-diagnostics-tmp" e digite ' ll ' novamente para garantir que os diretórios tenham sido excluídos/removidos. 

 

Exemplo de resultado: 

service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 

service@director-1-1-b:/diag> ll 
total 24 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag> 

 

  1. Se existir um diretório "collect-diagnostics-tmp-ext", remova-o e execute "rm -r collect-diagnostics-tmp-ext"  

 

Nota: Geralmente, o arquivo estendido é usado para investigar falhas de nó. Se houver uma investigação em andamento sobre uma falha de nó e o suporte não tiver capturado todos os registros necessários, verifique com o suporte antes de limpar o diretório collect-diagnostics-tmp-ext, pois isso pode excluir os arquivos principais necessários. 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 03 Apr 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.