Med tilføjelsen af understøttelse af Watchdog-hardware kan systemd nu udføre funktionen af en watchdog daemon Linux. På Dell PowerEdge-systemer kan denne hardware enten være chipsæt-watchdog-timeren indbygget i platformens chipsæt (som Intel ICH9) eller Dell iDRAC's IPMI-kompatible BMC watchdog-timer.
Dell iDRAC giver automatisk systemgendannelse , som ud over gendannelse fra operativsystemets fastlåsninger kan tage et skærmbillede til analyse senere. Det var nødvendigt at installere yderligere software på operativsystemet for at aktivere dette. Med nyere distributioner, der understøtter system, arbejder denne funktion med software, der er tilgængelig indbygget i en distribution, og eliminerer behovet for tilføjelsessoftware.
Det var imidlertid muligt at bruge watchdogd-daemonen på Linux, men der var en sandsynlighed for, hvor selve dæmonen kunne låse, mens resten af systemet var funktionsdygtig. systemd fungerer som software watchdog for alle systemtjenester, og BMC Watchdog Timer fungerer som hardware-watchdog for selve systemet. Så hvis systemd ikke fungerer, er der en god risiko for, at systemet generelt er ubrugeligt. Derfor har vi nu en mere pålidelig metode til alle systemtjenester, hvor administrator af tjenesterne (systemd) bliver "overvåget" af BMC's watchdog-timer.
Limen mellem system og Dell iDRAC's BMC Watchdog er ipmi_watchdog kernemodulet, som giver Linux Watchdog API-adgang til BMC Watchdog ved hjælp af /dev/watchdog. Systemd bruger denne grænseflade til at kickstarte watchdog med jævne mellemrum.
Opsætning af system med ipmi_watchdog
Systemd kan konfigureres til at bruge iDRAC BMC Watchdog med disse trin (på Fedora 19):
- Da systemet har to watchdog-timere (chipset og BMC), kan vi bruge en af dem. I dette eksempel deaktiverer vi chipsæt-watchdog'en. Chipset Watchdog kan deaktiveres ved at indstille indstillingen "operativsystemets Watchdog Timer" i systemets BIOS til "Disabled" (Deaktiveret) (standard).
- Ankommer til en timeout-værdi for watchdog, f.eks. 180 sekunder.
- Gør det muligt for ipmi_watchdog kernemodulet at indlæse ved systemopstart med timeout fra oven:
- Metode 1: Opret /etc/modules-load.d/ipmi_watchdog med følgende indhold
- Indstillinger ipmi_watchdog timeout=180
- Afvis liste iTCO_wdt # Valgfrit. Hvis chipset Watchdog ikke er deaktiveret i BIOS-opsætningen.
- Metode 2:
- Installer OpenIPMI rpm
- $ sudo yum install OpenIPMI
- Indstil IPMI_WATCHDOG=yes, og IPMI_WATCHDOG_OPTIONS med timeout i /etc/sysconfig/ipmi.
- Aktiver ipmi-tjenesten til at starte automatisk
- $ sudo systemctl enable ipmi
- Aktiver systemd's Watchdog:
- Fraråd og indstil RuntimeWatchdogSec=180 i /etc/systemd/system.conf
- Genstart systemd
- # systemctl daemon-reexec
Test, om dette virker:
- Kontroller, om Watchdog er aktiv
- $ sudo journalctl |grep -i 'hardware watchdog' # skal vise, at systemd er konfigureret til at bruge IPMI Watchdog.
- $ sudo ipmitool mc watchdog get # check, hvis "Watchdog Timer Er: Startet/i gang."
- Test af en kernepanik (gør ikke dette på et produktionssystem). Sørg for, at kdump er deaktiveret.
- $ sudo echo c > /proc/sysrq-trigger
- Efter systemnulstilling skal du kontrollere, at der findes et billede af fejlskærmen i iDRAC
- Log på iDRAC webbrugergrænsefladen
- Overview -> Server -> Troubleshooting -> Last Crash Screen .