Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Utilizzo di Systemd per il ripristino automatico del sistema

Summary: Con l'inclusione del supporto per l'hardware watchdog, systemd può ora eseguire la funzione di watchdog daemon Linux sui sistemi Dell PowerEdge.

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Instructions

Con l'inclusione del supporto per l'hardwareQuesto link ipertestuale indirizza a un sito web esterno a Dell TechnologieswatchdogQuesto link ipertestuale indirizza a un sito web esterno a Dell Technologies, systemdQuesto link ipertestuale indirizza a un sito web esterno a Dell Technologies può ora eseguire la funzione di un watchdog daemon Linux. Sui sistemi Dell PowerEdge, questo hardware potrebbe essere il timer di watchdog del chipset integrato nel chipset della piattaforma (come Intel ICH9) o il timer di watchdog BMC conforme a IPMI di Dell iDRAC.

Dell iDRAC fornisce il ripristino automatico del sistema che, oltre al ripristino dai blocchi del sistema operativo, può acquisire una schermata per l'analisi in un secondo momento. Per abilitare questa operazione era necessario un software aggiuntivo sul sistema operativo. Con distribuzioni più recenti che supportano il sistema, questa funzione funziona con il software disponibile in modo nativo in una distribuzione, eliminando la necessità di software add-on.

È stato tuttavia possibile utilizzare il daemon watchdogd su Linux, ma c'era una probabilità in cui il daemon stesso potesse bloccarsi mentre il resto del sistema era operativo. systemd funge da watchdog software per tutti i servizi di sistema e il timer di watchdog BMC funge da watchdog hardware per systemd stesso. Pertanto, se systemd non è operativo, c'è una buona probabilità che il sistema sia inutilizzabile in generale. Ora disponiamo di un metodo più affidabile per tutti i servizi di sistema, il responsabile dei servizi (systemd) che viene "osservato" dal watchdog timer di BMC.

Il colla tra systemd e il watchdog BMC di Dell iDRAC è il modulo kernel ipmi_watchdog, che fornisce l'accesso all'API Questo link ipertestuale indirizza a un sito web esterno a Dell Technologieswatchdog linux al watchdog BMC tramite /dev/watchdog. Systemd utilizza questa interfaccia per avviare periodicamente il watchdog.

Configurazione sistemata con ipmi_watchdog

Systemd può essere configurato per utilizzare il watchdog BMC di iDRAC con questi passaggi (su Fedora 19):

  1. Poiché il sistema dispone di due timer watchdog (chipset e BMC), è possibile utilizzare entrambi. Per questo esempio, si disabilita il watchdog del chipset. Il watchdog del chipset può essere disabilitato impostando l'opzione "Operating system Watchdog Timer" nel BIOS di sistema su "Disabled" (disabilitata) (impostazione predefinita).
  2. Arrivare a un valore di timeout per il watchdog, ad esempio 180 secondi.
  3. Abilitare il ipmi_watchdog modulo kernel per il caricamento all'avvio del sistema con il timeout indicato sopra:
  • Metodo 1. Creare il file /etc/modules-load.d/ipmi_watchdog con il seguente contenuto
    • Opzioni ipmi_watchdog timeout=180
    • Nega elenco iTCO_wdt n. opzionale. Se il watchdog del chipset non è disabilitato nella configurazione del BIOS.
  • Metodo 2.
    • Installare l'rpm OpenIPMI
      • $ sudo yum installare OpenIPMI
    • Impostare IPMI_WATCHDOG=yes e IPMI_WATCHDOG_OPTIONS con il timeout in /etc/sysconfig/ipmi.
    • Abilitare l'avvio automatico del servizio ipmi
      • $ sudo systemctl enable ipmi
  • Abilitare il watchdog di systemd:
    • Rimuovere il commento e impostare RuntimeWatchsec=180 in /etc/systemd/system.conf
  • Riavviare il sistema
    • # systemctl daemon-reexec

Verificare se funziona:

  1. Controllare se il watchdog è attivo
    • $ sudo journalctl |grep -i 'hardware watchdog' # dovrebbe mostrare che systemd è configurato per utilizzare il watchdog IPMI.
    • $ sudo ipmitool mc watchdog get # verificare se "Watchdog Timer Is: Avviato/in esecuzione.
  2. Eseguire un test simulando un errore grave del kernel (non eseguire questa operazione su un sistema di produzione). Assicurarsi che kdump sia disabilitato.
    • $ sudo echo c > /proc/sysrq-trigger
  3. Dopo il ripristino del sistema, verificare che l'immagine della schermata di errore sia disponibile in iDRAC
    • Accedere all'interfaccia utente web di iDRAC
    • Panoramica -> Server -> Risoluzione dei problemi -> ultima schermata di arresto anomalo.
NOTA: Questa funzione non è attualmente supportata da Dell ed è condivisa qui con l'intento di richiedere feedback dalla community in Linux Resources for PowerEdge Servers.

Article Properties


Last Published Date

19 Sep 2023

Version

6

Article Type

How To