Procedura per eseguire le seguenti attività:
A. Quali registri sono necessari per eseguire il debug dei problemi del nodo metro?
Note:
Si tratta di esempi che rappresentano questi due nomi di file. La data e l'ora nel formato YYYY-MM-DD-HH.MM.SS indicano quelle in cui sono stati raccolti:
B. Come si acquisisce collect-diagnostics sul cluster di un nodo metro?
Nota: il file di base, che riguarda gli ultimi 30 giorni, è sufficiente per analizzare e risolvere la maggior parte dei problemi. Queste opzioni devono essere utilizzate se non diversamente indicato dal supporto.
Per acquisire questi dati, eseguire un comando collect-diagnostics con i seguenti flag: "--noextended" e "--last-logs 30d".
Stabilire una sessione SSH in un prompt Linux di un nodo Director, ad esempio service@director-1-1-a, quindi accedere a vplexcli.
Output di esempio:
login as: service Keyboard-interactive authentication prompts from server: | Password: End of keyboard-interactive prompts from server Last login: <date and timestamp data> from x.x.x.x service@director-1-1-a:~> service@director-1-1-a:~> vplexcli Trying ::1... Connected to localhost. Escape character is '^]'. VPlexcli:/>
Esempio di output:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2024-02-09 19:55:13 UTC: No cluster-witness server found. 2024-02-09 19:55:13 UTC: Free space = 88G 2024-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
C. Come confermare i pacchetti di raccolta della diagnostica esistenti sul Director/nodo.
Al termine del comando collect-diagnostics, quando viene nuovamente visualizzato il prompt di vplexcli, connettersi al director da cui è stato eseguito il comando tramite winscp [o un'utilità SCP equivalente] e passare a /diag/collect-diagnostics-out/
Identificare i file di registro con il timestamp corretto e scaricarli sulla workstation locale.
D. Come interrompere un processo collect-diagnostics in corso
Nota: si tratta di un'attività senza interruzioni. Poiché non vi sono comandi diretti per interrompere il processo di raccolta, è necessario riavviare la console di gestione. Tuttavia, prima di interrompere un processo collect-diagnostics in esecuzione, contattare il supporto per spiegare il motivo per cui si desidera interromperlo e verificare che sia fattibile, in quanto potrebbero essere presenti dati a rischio di perdita. Questi dati persi non saranno nuovamente disponibili per la raccolta quando il processo viene ripetuto dopo l'azione di interruzione.
Output di esempio:
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 2022-02-09 19:55:13 UTC: No cluster-witness server found. 2022-02-09 19:55:13 UTC: Free space = 88G 2022-02-09 19:55:13 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection ..
Output di esempio:
login as: service Using keyboard-interactive authentication. Password: Last login: <date and time stamp data> from x.x.x.x service@director-1-1-b:~>
Output di esempio:
service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service
"Connection closed by foreign host."
Output di esempio (controllare l'ultima riga dell'output):
VPlexcli:/> collect-diagnostics --noextended --last-logs 30d ('WARNING:The collect-diagnostics command was issued with option --noextended. ',) The following file(s) will NOT be collected: core files fast trace dump files slow trace dump files udcom trace dump files udcom legacy trace files user-defined performance sink files the management console's heap ('WARNING:Only the logs that are generated in the last 30 days are collected.') 2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 2022-02-09 20:02:04 UTC: No cluster-witness server found. 2022-02-09 20:02:04 UTC: Free space = 88G 2022-02-09 20:02:04 UTC: Total space needed = 1907M ================================================================================ Starting collect-diagnostics, this operation might take a while... ================================================================================ Executing cluster collection .. ERROR Executing SMS log collection .. Connection closed by foreign host. <<<
*se non sono stati omessi file estesi
Output di esempio:
service@director-1-1-b:/diag> ll total 32 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-tmp-ext drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:03 collect-diagnostics-jobs drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwxr-xr-x 3 service groupSvc 4096 Feb 9 20:02 collect-diagnostics-tmp drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
Output di esempio:
service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp service@director-1-1-b:/diag> ll total 24 drwxr-xr-x 2 service groupSvc 4096 Feb 9 20:04 collect-diagnostics-out drwx------ 2 root root 16384 Jan 27 16:54 lost+found drwx--x--x 3 service groupSvc 4096 Dec 17 03:08 share service@director-1-1-b:/diag>
Nota: il file esteso viene in genere utilizzato per analizzare gli arresti anomali dei nodi. Se è in corso un'indagine su un arresto anomalo del nodo e il supporto non ha acquisito tutti i registri necessari, verificare con il supporto prima di pulire la directory collect-diagnostics-tmp-ext, in quanto questa operazione potrebbe eliminare i file di base necessari.