メイン コンテンツに進む
  • すばやく簡単にご注文が可能
  • 注文内容の表示、配送状況をトラック
  • 会員限定の特典や割引のご利用
  • 製品リストの作成とアクセスが可能

Utilizzo di Systemd per il ripristino automatico del sistema

概要: Con l'inclusione del supporto per l'hardware watchdog, systemd può ora eseguire la funzione di watchdog daemon Linux sui sistemi Dell PowerEdge.

この記事は次に適用されます: この記事は次には適用されません: この記事は、特定の製品に関連付けられていません。 すべての製品パージョンがこの記事に記載されているわけではありません。

手順

Con l'inclusione del supporto per l'hardwareQuesto link ipertestuale indirizza a un sito web esterno a Dell TechnologieswatchdogQuesto link ipertestuale indirizza a un sito web esterno a Dell Technologies, systemdQuesto link ipertestuale indirizza a un sito web esterno a Dell Technologies può ora eseguire la funzione di un watchdog daemon Linux. Sui sistemi Dell PowerEdge, questo hardware potrebbe essere il timer di watchdog del chipset integrato nel chipset della piattaforma (come Intel ICH9) o il timer di watchdog BMC conforme a IPMI di Dell iDRAC.

Dell iDRAC fornisce il ripristino automatico del sistema che, oltre al ripristino dai blocchi del sistema operativo, può acquisire una schermata per l'analisi in un secondo momento. Per abilitare questa operazione era necessario un software aggiuntivo sul sistema operativo. Con distribuzioni più recenti che supportano il sistema, questa funzione funziona con il software disponibile in modo nativo in una distribuzione, eliminando la necessità di software add-on.

È stato tuttavia possibile utilizzare il daemon watchdogd su Linux, ma c'era una probabilità in cui il daemon stesso potesse bloccarsi mentre il resto del sistema era operativo. systemd funge da watchdog software per tutti i servizi di sistema e il timer di watchdog BMC funge da watchdog hardware per systemd stesso. Pertanto, se systemd non è operativo, c'è una buona probabilità che il sistema sia inutilizzabile in generale. Ora disponiamo di un metodo più affidabile per tutti i servizi di sistema, il responsabile dei servizi (systemd) che viene "osservato" dal watchdog timer di BMC.

Il colla tra systemd e il watchdog BMC di Dell iDRAC è il modulo kernel ipmi_watchdog, che fornisce l'accesso all'API Questo link ipertestuale indirizza a un sito web esterno a Dell Technologieswatchdog linux al watchdog BMC tramite /dev/watchdog. Systemd utilizza questa interfaccia per avviare periodicamente il watchdog.

Configurazione sistemata con ipmi_watchdog

Systemd può essere configurato per utilizzare il watchdog BMC di iDRAC con questi passaggi (su Fedora 19):

  1. Poiché il sistema dispone di due timer watchdog (chipset e BMC), è possibile utilizzare entrambi. Per questo esempio, si disabilita il watchdog del chipset. Il watchdog del chipset può essere disabilitato impostando l'opzione "Operating system Watchdog Timer" nel BIOS di sistema su "Disabled" (disabilitata) (impostazione predefinita).
  2. Arrivare a un valore di timeout per il watchdog, ad esempio 180 secondi.
  3. Abilitare il ipmi_watchdog modulo kernel per il caricamento all'avvio del sistema con il timeout indicato sopra:
  • Metodo 1. Creare il file /etc/modules-load.d/ipmi_watchdog con il seguente contenuto
    • Opzioni ipmi_watchdog timeout=180
    • Nega elenco iTCO_wdt n. opzionale. Se il watchdog del chipset non è disabilitato nella configurazione del BIOS.
  • Metodo 2.
    • Installare l'rpm OpenIPMI
      • $ sudo yum installare OpenIPMI
    • Impostare IPMI_WATCHDOG=yes e IPMI_WATCHDOG_OPTIONS con il timeout in /etc/sysconfig/ipmi.
    • Abilitare l'avvio automatico del servizio ipmi
      • $ sudo systemctl enable ipmi
  • Abilitare il watchdog di systemd:
    • Rimuovere il commento e impostare RuntimeWatchsec=180 in /etc/systemd/system.conf
  • Riavviare il sistema
    • # systemctl daemon-reexec

Verificare se funziona:

  1. Controllare se il watchdog è attivo
    • $ sudo journalctl |grep -i 'hardware watchdog' # dovrebbe mostrare che systemd è configurato per utilizzare il watchdog IPMI.
    • $ sudo ipmitool mc watchdog get # verificare se "Watchdog Timer Is: Avviato/in esecuzione.
  2. Eseguire un test simulando un errore grave del kernel (non eseguire questa operazione su un sistema di produzione). Assicurarsi che kdump sia disabilitato.
    • $ sudo echo c > /proc/sysrq-trigger
  3. Dopo il ripristino del sistema, verificare che l'immagine della schermata di errore sia disponibile in iDRAC
    • Accedere all'interfaccia utente web di iDRAC
    • Panoramica -> Server -> Risoluzione dei problemi -> ultima schermata di arresto anomalo.
NOTA: Questa funzione non è attualmente supportata da Dell ed è condivisa qui con l'intento di richiedere feedback dalla community in Linux Resources for PowerEdge Servers.
文書のプロパティ
文書番号: 000146106
文書の種類: How To
最終更新: 17 8月 2024
バージョン:  7
質問に対する他のDellユーザーからの回答を見つける
サポート サービス
お使いのデバイスがサポート サービスの対象かどうかを確認してください。