Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Использование Systemd для автоматизированного восстановления системы

Summary: Благодаря включенной поддержке оборудования для наблюдения systemd теперь может выполнять функции управляющей программы наблюдения Linux на системах Dell PowerEdge.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Instructions

Благодаря включениюЭта гиперссылка позволяет перейти на сайт за пределами Dell Technologies.поддержки дляЭта гиперссылка позволяет перейти на сайт за пределами Dell Technologies. оборудования наблюдения systemdЭта гиперссылка позволяет перейти на сайт за пределами Dell Technologies. теперь может выполнять функции управляющей программы наблюдения Linux. В системах Dell PowerEdge это оборудование может быть либо таймером наблюдения для набора микросхем, встроенным в набор микросхем платформы (например, Intel ICH9), либо таймером наблюдения BMC, совместимым с IPMI Dell iDRAC.

Dell iDRAC обеспечивает автоматическое восстановление системы, которое в дополнение к восстановлению после блокировок операционной системы может сделать снимок экрана для анализа позже. Для этого необходимо было дополнительное программное обеспечение операционной системы. В более новых дистрибутивах, поддерживающих systemd, эта функция работает с программным обеспечением, доступным в дистрибутиве, что устраняет необходимость в дополнительных программном обеспечении.

Однако в Linux можно было использовать управляющую группу, но существует вероятность того, что управляющая программа может заблокироваться во время работы остальной системы. systemd выступает в качестве таймера наблюдения по всем системным службам, а таймер наблюдения BMC выступает в качестве таймера наблюдения оборудования для системы. Поэтому, если система не используется, существует вероятность того, что система будет непригодной для использования в целом. Теперь у нас есть более надежный метод для всех системных служб— диспетчер служб (systemd), который будет «наблюдать» таймером наблюдения BMC.

Клемма между systemd и сторожевым таймером BMC Dell iDRAC — это модуль ядра ipmi_watchdog, который предоставляет API-интерфейсуЭта гиперссылка позволяет перейти на сайт за пределами Dell Technologies. наблюдения Linux доступ к сторожевом окне BMC с помощью /dev/watchdog. Systemd периодически использует этот интерфейс для запуска таймера наблюдения.

Настройка системы с помощью ipmi_watchdog

Systemd можно настроить на использование сторожевой таймер iDRAC BMC с помощью следующих действий (на Fedora 19):

  1. Поскольку в системе имеется два сторожовых таймера (набор микросхем и BMC), мы можем использовать любой из них. В данном примере мы отключаем сторожевое таймер набора микросхем. Сторожевой таймер набора микросхем можно отключить, нажав в BIOS параметр «Таймер наблюдения операционной системы» на «Отключено» (по умолчанию).
  2. Приведите значение тайм-аута для таймера наблюдения, 180 секунд.
  3. Включите ipmi_watchdog ядра для загрузки при запуске системы с тайм-аутом, указанным выше:
  • Способ 1. Создайте файл /etc/modules-load.d/ipmi_watchdog со следующим содержимым.
    • Параметры ipmi_watchdog тайм-аут =180
    • Список отклонений iTCO_wdt # Необязательно. Если сторожевое таймер набора микросхем не отключено в программе настройки BIOS,
  • Способ 2.
    • Установка OpenIPMI rpm
      • $ sudo yum install OpenIPMI
    • Установите IPMI_WATCHDOG=yes и IPMI_WATCHDOG_OPTIONS с тайм-аутом в /etc/sysconfig/ipmi.
    • Включение автоматического запуска службы ipmi
      • $ sudo systemctl enable ipmi
  • Включите сторожевую таймер системы:
    • Распакуйте и задайте RuntimeWatchdogSec=180 в /etc/systemd/system.conf
  • Перезапустите систему.
    • # systemctl daemon-reexec

Проверьте, работает ли это.

  1. Проверьте, активен ли таймер наблюдения.
    • $ sudo journalctl |grep -i «hardware watchdog» # должен показывать, что systemd настроен для использования таймера наблюдения IPMI.
    • $ sudo ipmitool mc watchdog получить # проверить, установлен ли параметр «Watchdog Timer Is: Started/Running».
  2. Выполните проверку, упростив ошибку ядра (не выполнив эту проверку в производственной системе). Убедитесь, что kdump отключен.
    • $ sudo echo c > /proc/sysrq-trigger
  3. После сброса системы убедитесь, что в iDRAC имеется изображение экрана сбоя.
    • Вход в веб-интерфейс iDRAC
    • Overview -> Server -> Troubleshooting -> Last Crash Screen.
ПРИМЕЧАНИЕ. В настоящее время Dell не поддерживает эту функцию и предоставляет ее с намерением запрашивать обратную связь от сообщества на сайте Linux Resources for PowerEdge Servers.

Article Properties


Last Published Date

19 Sep 2023

Version

6

Article Type

How To