Метро-кластер: Сбор журналов из узла Metro

Summary: В этой статье описываются шаги по сбору журналов с узла Metro, а также описываются журналы и данные, которые могут потребоваться для решения проблемы с производительностью.

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Check out other resources

Instructions

Шаги по выполнению следующих задач:

Какие журналы необходимы для отладки проблем с метрокластером?
Как собрать данные collect-diagnostics в кластере узла Metro?
Как проверить существующие пакеты для сбора данных диагностики на серверах управления.
Как прервать и очистить текущий сбор и диагностику в узле Metro?

Примечание.: Если требуются журналы SupportAssist, отсылайте заказчика к статье базы знаний, 000135669 «Как экспортировать собранные журналы SupportAssist из SupportAssist Enterprise? Подключено или отключено А

. Какие журналы необходимы для отладки проблем с метрокластером?

Команда, необходимая для сбора журналов с узла Metro, называется «collect-diagnostics» и может быть запущена с любого [^1] узла в программе настройки узла Metro. При выполнении этой команды на одном директоре кластера Metro Node должны быть получены все данные от всех директоров со всех узлов кластера. НЕ выполняйте эту команду более чем на одном узле одновременно.

[1] ПРИМЕЧАНИЕ: Выполните команду «collect-diagnostics» только из одного директора, только в одном кластере в конфигурации Metro и дождитесь полного завершения, прежде чем собирать компакт-диски от другого директора или однорангового кластера, если это необходимо.

Команда «collect-diagnostics» создает сжатый tar.gz файл журнала, содержащий файлы конфигурации и журнала. Файл collect-diagnostics помещается в каталог /diag/collect-diagnostics-out/ на узле, с которого он был запущен. После завершения выполнения команды с помощью WINSCP или аналогичной утилиты SCP скопируйте файл с узла, после чего он может быть предоставлен службе поддержки для анализа. Дополнительные сведения об использовании этой команды см. в разделе B ниже.

Примечания.

Если команда «collect-diagnostics» выполняется без параметров, создаются два файла: базовый и расширенный. На масштабируемых системах это может занять довольно много времени.
Для поддержки узла Metro обычно требуется только файл Base, однако в некоторых случаях, из-за проблем с производительностью, может потребоваться и расширенный файл.
При выполнении диагностики collect-diagnostics могут потребоваться стандартные параметры:

"--noextended", этот параметр опускает сбор расширенной диагностики.

«--last-logs», этот параметр захватывает журналы за x часов или дней.

Для получения дополнительных сведений о команде введите «collect-diagnostics -h».

Вот примеры того, как выглядят эти два имени файла, дата и время, показанные как YYYY-MM-DD-HH.MM.SS, будут отсчитываться от даты и времени их сбора:

Базовый файл — <серийный номер>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz
Расширенный файл — <серийный номер>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz

Проблемы производительности сложны и требуют сбора большого количества конкретной информации. В результате у нас есть анкета по производительности, которую клиенты должны заполнить, чтобы ускорить этот процесс. Анкету можно найти в приложении к этой статье базы знаний в разделе вложения в конце.

При некоторых типах проблем производительности полезно создать дополнительный журнал под названием «fe_perf_stats». Журналы создаются непрерывно, но не регистрируются функцией collect-diagnostics. Чтобы записать этот журнал, перейдите по cd (change directory) в /var/log/VPlex/ cli на узле каждого кластера и выполните команду «tar cvzf fe-perf-stats.tar.gz fe_perf_stats*», чтобы сжать данные файлов в tar-файл. Подключитесь к узлу с помощью WINSCP или аналогичной утилиты SCP и перейдите в /var/log/VPlex/cli. Скопируйте файл fe-perf-stats.tar.gz в систему. Загрузите TAR-файл вместе с файлом (файлами) collect-diagnostics (по запросу службы поддержки) в SR или отправьте вам FTP-ссылку, которую служба поддержки предоставит вам в SR и по электронной почте.

В дополнение к сбору диагностических данных может быть полезно собрать следующую информацию:

открытое логирование для сеанса PuTTY,
затем выполните команды, указанные ниже.
затем соберите журнал Putty и загрузите в свою систему,
затем прикрепите журнал PuTTY, collect-diagnostics и любые другие данные,
запрошенные к SR.

Следующие команды необходимо выполнить из командной строки VPlexcli.

Состояние кластера
ll clusters/**/storage-views/* --full
ll ~порты
show-use-hierarchy /clusters/**/virtual-volumes/*
ll ~системные-тома
ls -t /clusters/*/directors/*::serial-number [эта команда выведет список всех DST для каждого узла]
ls -t /clusters/**/director-*/::hostname [отображаемые имена хостов будут IP-адресами, это ожидаемо]

B. Как собрать данные collect-diagnostics в кластере узла Metro?

Примечание.: Базового файла, охватывающего последние 30 дней, достаточно для изучения и решения большинства проблем. Эти параметры следует использовать, если иное не указано службой поддержки.
Чтобы собрать эти данные, выполните команду collect-diagnostics со следующими флагами «--noextended» и «--last-logs 30d».

Создайте сеанс SSH в командной строке узла директор Linux, например service@director-1-1-a, затем войдите в vplexcli.

Пример вывода:

login as: service 
Keyboard-interactive authentication prompts from server: 
| Password: 
End of keyboard-interactive prompts from server 
Last login: <date and timestamp data> from x.x.x.x
service@director-1-1-a:~> 
service@director-1-1-a:~> vplexcli 
Trying ::1... 
Connected to localhost. 
Escape character is '^]'. 
 
VPlexcli:/>

Чтобы запустить collect-diagnostics, в командной строке vplexcli выполните команду collect-diagnostics с указанными параметрами, как показано в примере ниже.

Пример выходных данных:

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2024-02-09 19:55:13 UTC: No cluster-witness server found. 
2024-02-09 19:55:13 UTC: Free space = 88G 
2024-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..

C. Проверка существующих пакетов collect-diagnostics в директоре/узле.

Когда команда collect-diagnostics завершится и вернется в командную строку vplexcli, подключитесь к директору, с которого вы выполнили команду, с помощью winscp [или аналогичной утилиты SCP] и перейдите в папку /diag/collect-diagnostics-out/

Определите файлы журнала с правильной меткой времени и скачайте их на локальную рабочую станцию.

D. Как прервать текущую диагностику

Примечание: Это мероприятие не нарушает работу системы. Так как прямые команды для прерывания процесса сбора данных отсутствуют, необходимо перезапустить консоль управления. Тем не менее, прежде чем прерывать выполнение диагностики сбора, обратитесь в службу поддержки, чтобы объяснить, почему вы хотите прервать выполнение диагностики сбора, чтобы убедиться, что все в порядке, так как некоторые данные могут быть потеряны. Эти потерянные данные больше не будут доступны для сбора при повторном запуске диагностики сбора после прерывания.

Если вы все еще находитесь в сеансе PuTTY, в котором была запущена диагностика сбора, вы должны увидеть потоковую передачу выходных данных collect-diagnostics, показывающую, что она все еще выполняется.

Пример вывода:

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2022-02-09 19:55:13 UTC: No cluster-witness server found. 
2022-02-09 19:55:13 UTC: Free space = 88G 
2022-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..

Откройте дубликат сеанса PuTTY и войдите в директор, где была запущена сбор данных, используя сервисную учетную запись.

  Пример вывода:

login as: service 
Using keyboard-interactive authentication. 
Password: 
Last login: <date and time stamp data> from x.x.x.x 
service@director-1-1-b:~>

Оказавшись в директоре, перезапустите консоль управления с помощью следующей команды, чтобы прервать выполняемую диагностику сбора.

Пример вывода:

service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service

Оглядываясь назад на первый сеанс PuTTY, в котором была запущена диагностика сбора, при перезапуске консоли управления вы должны увидеть отчет collect-diagnostics следующего в качестве последнего записанного вывода:

"Connection closed by foreign host."

Пример выходных данных (проверьте последнюю строку вывода):

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
2022-02-09 20:02:04 UTC: No cluster-witness server found. 
2022-02-09 20:02:04 UTC: Free space = 88G 
2022-02-09 20:02:04 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..                               ERROR 
Executing SMS log collection ..                               Connection closed by foreign host. <<<

Как только сбор диагностики остановлен, шаг 3 выше, вернитесь ко второму сеансу PuTTY и перейдите в каталог /diag, затем запустите « ll », и вы увидите несколько дополнительных каталогов.

collect-diagnostics-tmp
collect-diagnostics-jobs
collect-diagnostics-tmp-ext*

* Если расширенные файлы не были опущены

Пример вывода:

service@director-1-1-b:/diag> ll 
total 32 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag>

Если вы заглянете внутрь каждого из этих каталогов, вы увидите файлы с датой и временем запуска отмененной коллекционной диагностики. Эти файлы занимают место в разделе /diag и должны быть удалены.

Чтобы удалить/удалить файлы из каталога /diag, введите «rm -r collect-diagnostics-jobs» и «rm -r collect-diagnostics-tmp», затем снова введите « ll », чтобы убедиться, что каталоги удалены.

Пример вывода:

service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 

service@director-1-1-b:/diag> ll 
total 24 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag>

Если каталог «collect-diagnostics-tmp-ext» существует, удалите его, выполнив команду «rm -r collect-diagnostics-tmp-ext»

Примечание.: Расширенный файл обычно используется для исследования сбоев узлов. Если по факту сбоя узла ведется настоящее расследование и служба поддержки не собрала все необходимые журналы, перед очисткой каталога collect-diagnostics-tmp-ext обратитесь в службу поддержки, так как это может привести к удалению необходимых файлов главного сервера.

Affected Products

metro node mn-114, metro node mn-215

Article Number: 000197436

Article Type: How To

Last Modified: 03 Apr 2024

Version: 6

Check if your device is covered by Support Services.

Метро-кластер: Сбор журналов из узла Metro

Instructions

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services

Welcome

Welcome to Dell

Метро-кластер: Сбор журналов из узла Metro

Detailed Article

Instructions

Affected Products

Instructions

Affected Products

Article Properties

Find answers to your questions from other Dell users

Support Services

Article Properties

Find answers to your questions from other Dell users

Support Services