메인 콘텐츠로 이동
  • 빠르고 간편하게 주문
  • 주문 보기 및 배송 상태 추적
  • 제품 목록을 생성 및 액세스
  • 회사 관리를 사용하여 Dell EMC 사이트, 제품 및 제품 수준 연락처를 관리하십시오.

Korzystanie z systemu do automatycznego odzyskiwania systemu

요약: Po włączeniu obsługi sprzętu watchdog systemd może teraz wykonywać funkcję demona alarmowego Linux w systemach Dell PowerEdge.

이 문서는 자동으로 번역되었을 수 있습니다. 번역 품질에 대한 의견이 있는 경우 페이지 하단의 양식을 사용해 알려 주시기 바랍니다.

문서 콘텐츠


지침

Po włączeniuKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies. obsługi sprzętu watchdogKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.systemdKliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies. może teraz wykonywać funkcję demona alarmowego Linux. W systemach Dell PowerEdge ten sprzęt może być układem licznika alarmowego chipsetu wbudowanym w chipset platformy (takim jak Intel ICH9) lub licznikiem alarmowym BMC zgodnym ze standardem IPMI kontrolera iDRAC.

Kontroler iDRAC firmy Dell zapewnia automatyczne odzyskiwanie systemu , które poza odzyskiwaniem systemu operacyjnego może zrobić zrzut ekranu do późniejszej analizy. Aby włączyć tę funkcję, konieczne było dodatkowe oprogramowanie w systemie operacyjnym. Dzięki nowszym dystrybucjom obsługującym systemy funkcja ta współpracuje z oprogramowaniem dostępnym natywnie w dystrybucji, eliminując potrzebę dodatkowego oprogramowania.

Możliwe było jednak użycie demona alarmowego w systemie Linux, ale istniało prawdopodobieństwo, że demon może się zablokować, gdy reszta systemu działała. systemd działa jako watchdog oprogramowania dla wszystkich usług systemowych, a licznik alarmowy BMC działa jako watchdog sprzętu dla samego systemu. Jeśli więc systemd nie działa, istnieje duża szansa, że system ogólnie nie będzie można go używać. Dlatego teraz oferujemy bardziej niezawodną metodę dla wszystkich usług systemowych, a menedżer usług (systemd) jest "obserwowany" przez licznik alarmowy BMC.

Klej między systemowym i kontrolerem BMC kontrolera iDRAC firmy Dell jest modułem jądra ipmi_watchdog, który zapewnia dostęp do watchdog API Kliknięcie tego hiperłącza powoduje wyświetlenie strony spoza witryny Dell Technologies.systemu Linux do licznika alarmowego BMC za pomocą /dev/watchdog. Systemd używa tego interfejsu do okresowego uruchamiania licznika alarmowego.

Konfigurowanie systemu za pomocą ipmi_watchdog

Systemd można skonfigurować do korzystania z kontrolera iDRAC BMC watchdog z tymi czynnościami (na Fedora 19):

  1. Ponieważ system ma dwa liczniki alarmowe (chipset i BMC), możemy użyć jednego z nich. W tym przykładzie wyłączamy układ watchdog chipsetu. Licznik alarmowy chipsetu można wyłączyć, ustawiając opcję "System operacyjny Watchdog Timer" w systemie BIOS na "Disabled" (Wyłączone) (ustawienie domyślne).
  2. Przybędzie wartość limitu czasu dla licznika alarmowego, powiedzmy 180 sekund.
  3. Włącz moduł jądra ipmi_watchdog wczytywanie podczas uruchamiania systemu z upływem limitu czasu z góry:
  • Metoda 1: Utwórz plik /etc/modules-load.d/ipmi_watchdog z następującą zawartością
    • Opcje ipmi_watchdog limit czasu = 180
    • Lista odrzuć iTCO_wdt # opcjonalna. Jeśli układ watchdog chipsetu nie jest wyłączony w konfiguracji systemu BIOS.
  • Metoda 2:
    • Instalacja pakietu RPM OpenIPMI
      • $ sudo yum zainstaluj OpenIPMI
    • Ustaw IPMI_WATCHDOG=yes i IPMI_WATCHDOG_OPTIONS z limitem czasu w /etc/sysconfig/ipmi.
    • Włącz automatyczne uruchamianie usługi ipmi
      • $ sudo systemctl enable ipmi
  • Włącz licznik alarmowy systemu:
    • Usuń wykorzystanie i ustaw RuntimeWatchwatchSec= 180 w /etc/systemd/system.conf
  • Uruchom ponownie system
    • # systemctl daemon-reexec

Sprawdź, czy to działa:

  1. Sprawdź, czy licznik alarmowy jest aktywny
    • $ sudo journalctl |grep -i 'hardware watchdog' # powinien wskazywać, że systemd jest skonfigurowany do korzystania z licznika alarmowego IPMI.
    • $ sudo ipmitool mc watchdog get # check if the "Watchdog Timer Is: Rozpoczęto/uruchomiono".
  2. Przetestuj test, symulując awarię jądra (nie rób tego w systemie produkcyjnym). Upewnij się, że kdump jest wyłączony.
    • $ sudo echo c > /proc/sysrq-trigger
  3. Po zresetowaniu systemu sprawdź, czy obraz ekranu awarii jest dostępny w kontrolerze iDRAC
    • Zaloguj się do internetowego interfejsu użytkownika kontrolera iDRAC
    • Overview -> Server -> Troubleshooting -> Last Crash Screen (Przegląd -> Server -> Troubleshooting -> Last Crash Screen ( Ostatnia awaria).
UWAGA: Ta funkcja jest obecnie nieobsługiowana przez firmę Dell i jest udostępniana tutaj w celu uzyskania informacji zwrotnych od społeczności w zasobach Linux dla serwerów PowerEdge.

문서 속성


마지막 게시 날짜

19 9월 2023

버전

6

문서 유형

How To