Nodo metro: come raccogliere i registri dal nodo metro

Summary: Questo articolo descrive la procedura per raccogliere i registri dal nodo metro e illustra anche i registri/dati che potrebbero essere necessari per un problema di prestazioni.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Instructions

Procedura per eseguire le seguenti attività:

Quali registri sono necessari per eseguire il debug dei problemi del nodo metro?
Come si acquisisce collect-diagnostics sul cluster di un nodo metro?
Come confermare i pacchetti di raccolta della diagnostica esistenti sui server di gestione?
Come interrompere e pulire un processo collect-diagnostics in corso nel nodo metro?

A. Quali registri sono necessari per eseguire il debug dei problemi del nodo metro?

Il comando necessario per raccogliere i registri dal nodo metro è denominato "collect-diagnostics" e può essere eseguito da qualsiasi^[1] nodo nella configurazione del nodo metro. L'esecuzione di questo comando su un Director del cluster di un nodo metro deve includere tutti i dati di tutti i Director, da tutti i nodi di un cluster. NON eseguire questo comando su più di un nodo alla volta.

[1] NOTE: eseguire il comando "collect-diagnostics" da un solo Director, su un solo cluster in caso di una configurazione Metro, e attendere il completamento del comando prima di raccogliere la diagnostica da un altro Director o dal cluster peer, se necessario.

Il comando "collect-diagnostics" produce un file di registro tar.gz compresso contenente i file di configurazione e di registro. Il file collect-diagnostics viene posizionato nella directory /diag/collect-diagnostics-out/ sul nodo da cui è stato eseguito. Al completamento del comando utilizzare WINSCP o un'utilità SCP equivalente per copiare il file dal nodo. A questo punto può essere fornito per supportare l'analisi. Sono disponibili ulteriori informazioni sull'utilizzo di questo comando nella sezione B riportata di seguito.

Note:

Se il comando "collect-diagnostics" viene eseguito senza opzioni, vengono generati due file, un file di base e un file esteso. Questa operazione può richiedere molto tempo sui sistemi dimensionati.
Il supporto del nodo metro richiede in genere solo il file di base. Tuttavia, in alcune circostanze, i problemi di prestazioni potrebbero richiedere anche il file esteso.
Le opzioni standard che può essere necessario utilizzare per l'esecuzione di collect-diagnostics sono:

"--noextended", questa opzione omette la raccolta della diagnostica estesa.

"--last-logs", questa opzione acquisisce i registri per x ore o giorni precedenti.

Per maggiori dettagli sul comando è possibile digitare "collect-diagnostics -h"

Si tratta di esempi che rappresentano questi due nomi di file. La data e l'ora nel formato YYYY-MM-DD-HH.MM.SS indicano quelle in cui sono stati raccolti:

File di base: <serial number>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
File esteso: <serial number>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz

I problemi di prestazioni sono complessi e richiedono la raccolta di molte informazioni specifiche. Di conseguenza, abbiamo un questionario sulle prestazioni che i clienti devono compilare per accelerare questo processo. Il questionario è allegato a questo articolo della Knowledge Base nella specifica sezione alla fine della pagina.

Per alcuni tipi di problemi di prestazioni, è utile acquisire un registro aggiuntivo denominato "fe_perf_stats". I registri vengono generati continuamente, ma non acquisiti tramite collect-diagnostics. Per acquisire questo registro, modificare la directory cd in /var/log/VPlex/cli su un nodo di ogni cluster ed eseguire il comando "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" per comprimere i dati dei file in un file TAR. Connettersi al nodo con WINSCP o un'utilità SCP equivalente e passare a /var/log/VPlex/cli. Copiare il file "fe-perf-stats.tar.gz" nel sistema. Eseguire l'upload del file TAR insieme ai file collect-diagnostics, se richiesto dal supporto, nella SR o un link FTP fornito dal supporto nella SR e in un'e-mail.

Oltre a raccogliere la diagnostica, potrebbe essere utile acquisire le seguenti informazioni:

aprire la registrazione per una sessione PuTTY,
eseguire i comandi riportati di seguito,
raccogliere il registro di PuTTY e scaricarlo sul sistema,
allegare il registro PuTTY, il registro di collect-diagnostics
e tutti gli altri dati richiesti alla SR.

I seguenti comandi devono essere eseguiti dal prompt di VPlexcli.

cluster status
ll clusters/**/storage-views/* --full
ll ~ports
show-use-hierarchy /clusters/**/virtual-volumes/*
ll ~system-volumes
ls -t /clusters/*/directors/*::serial-number [questo comando elenca tutti i DST per ogni nodo]
ls -t /clusters/**/director-*/::hostname [i nomi host visualizzati sono gli indirizzi IP, come previsto]

B. Come si acquisisce collect-diagnostics sul cluster di un nodo metro?

Nota: il file di base, che riguarda gli ultimi 30 giorni, è sufficiente per analizzare e risolvere la maggior parte dei problemi. Queste opzioni devono essere utilizzate se non diversamente indicato dal supporto.
Per acquisire questi dati, eseguire un comando collect-diagnostics con i seguenti flag: "--noextended" e "--last-logs 30d".

Stabilire una sessione SSH in un prompt Linux di un nodo Director, ad esempio service@director-1-1-a, quindi accedere a vplexcli.

Output di esempio:

login as: service 
Keyboard-interactive authentication prompts from server: 
| Password: 
End of keyboard-interactive prompts from server 
Last login: <date and timestamp data> from x.x.x.x
service@director-1-1-a:~> 
service@director-1-1-a:~> vplexcli 
Trying ::1... 
Connected to localhost. 
Escape character is '^]'. 
 
VPlexcli:/>

Per avviare collect-diagnostics, dal prompt di vplexcli eseguire il comando "collect-diagnostics" con le opzioni indicate, come mostrato nell'esempio riportato di seguito.

Esempio di output:

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.
',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2024-02-09 19:55:13 UTC: No cluster-witness server found. 
2024-02-09 19:55:13 UTC: Free space = 88G 
2024-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..

C. Come confermare i pacchetti di raccolta della diagnostica esistenti sul Director/nodo.

Al termine del comando collect-diagnostics, quando viene nuovamente visualizzato il prompt di vplexcli, connettersi al director da cui è stato eseguito il comando tramite winscp [o un'utilità SCP equivalente] e passare a /diag/collect-diagnostics-out/

Identificare i file di registro con il timestamp corretto e scaricarli sulla workstation locale.

D. Come interrompere un processo collect-diagnostics in corso

Nota: si tratta di un'attività senza interruzioni. Poiché non vi sono comandi diretti per interrompere il processo di raccolta, è necessario riavviare la console di gestione. Tuttavia, prima di interrompere un processo collect-diagnostics in esecuzione, contattare il supporto per spiegare il motivo per cui si desidera interromperlo e verificare che sia fattibile, in quanto potrebbero essere presenti dati a rischio di perdita. Questi dati persi non saranno nuovamente disponibili per la raccolta quando il processo viene ripetuto dopo l'azione di interruzione.

Se si è ancora nella sessione PuTTY in cui è stato avviato collect-diagnostics, si dovrebbe visualizzare lo streaming dell'output ancora in esecuzione.

Output di esempio:

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.
',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2022-02-09 19:55:13 UTC: No cluster-witness server found. 
2022-02-09 19:55:13 UTC: Free space = 88G 
2022-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..

Aprire una sessione PuTTY duplicata e accedere al Director da cui è stata avviata il processo collect-diagnostics, utilizzando l'account di servizio.

  Output di esempio:

login as: service 
Using keyboard-interactive authentication. 
Password: 
Last login: <date and time stamp data> from x.x.x.x 
service@director-1-1-b:~>

Una volta sul Director, riavviare la console di gestione utilizzando il seguente comando per interrompere il processo in esecuzione.

Output di esempio:

service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service

Tornando alla prima sessione PuTTY in cui è in esecuzione collect-diagnostics, al riavvio della console di gestione dovrebbe essere visualizzato il seguente messaggio di collect-diagnostics come ultimo output indicato:

"Connection closed by foreign host."

Output di esempio (controllare l'ultima riga dell'output):

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.
',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
2022-02-09 20:02:04 UTC: No cluster-witness server found. 
2022-02-09 20:02:04 UTC: Free space = 88G 
2022-02-09 20:02:04 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..                               ERROR 
Executing SMS log collection ..                               Connection closed by foreign host. <<<

Una volta che collect-diagnostics risulta interrotto (passaggio 3 precedente), tornare alla seconda sessione PuTTY e utilizzare "cd" per passare alla directory /diag, quindi eseguire "ll" per visualizzare alcune directory aggiuntive:

collect-diagnostics-tmp
collect-diagnostics-jobs
collect-diagnostics-tmp-ext*

*se non sono stati omessi file estesi

Output di esempio:

service@director-1-1-b:/diag> ll 
total 32 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag>

Esaminando ciascuna di queste directory, si notano i file con la data e l'ora in cui è stato avviato il processo collect-diagnostics ora annullato. Questi file occupano spazio nella partizione /diag ed è opportuno rimuoverli.

Per rimuovere/eliminare i file dalla directory /diag, digitare "rm -r collect-diagnostics-jobs" e "rm -r collect-diagnostics-tmp", quindi inserire nuovamente "ll"per assicurarsi che le directory siano state eliminate/rimosse.

Output di esempio:

service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 

service@director-1-1-b:/diag> ll 
total 24 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag>

Se esiste una directory "collect-diagnostics-tmp-ext", rimuoverla eseguendo "rm -r collect-diagnostics-tmp-ext"

Nota: il file esteso viene in genere utilizzato per analizzare gli arresti anomali dei nodi. Se è in corso un'indagine su un arresto anomalo del nodo e il supporto non ha acquisito tutti i registri necessari, verificare con il supporto prima di pulire la directory collect-diagnostics-tmp-ext, in quanto questa operazione potrebbe eliminare i file di base necessari.

Affected Products

metro node mn-114, metro node mn-215

Article Number: 000197436

Article Type: How To

Last Modified: 20 Mar 2025

Version: 7

Check if your device is covered by Support Services.

Nodo metro: come raccogliere i registri dal nodo metro

Summary: Questo articolo descrive la procedura per raccogliere i registri dal nodo metro e illustra anche i registri/dati che potrebbero essere necessari per un problema di prestazioni.

Instructions

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

Nodo metro: come raccogliere i registri dal nodo metro

Summary: Questo articolo descrive la procedura per raccogliere i registri dal nodo metro e illustra anche i registri/dati che potrebbero essere necessari per un problema di prestazioni.

Detailed Article

Instructions

Affected Products

Instructions

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services