Dell PowerEdge-Server, auf denen iDRAC9 ausgeführt wird, weisen möglicherweise übermäßige SWC5008 Fehler auf, die sich auf die vordere LED in den Systemereignisprotokollen (SEL) beziehen. SWC5008-Ereignisse sind möglicherweise auch im iDRAC9 Lifecycle-Protokoll vorhanden. Diese Fehler treten aus verschiedenen Gründen auf. Der Artikel enthält Hintergrundinformationen zur LED-Controllerplatine und Methoden zur Diagnose von Fehlersichtungen.
Beschreibung:
Der SWC5008 Fehler wird wie unten in Abbildung 1 und den Tabellen 1 und 2 angezeigt.
Abbildung 1: Beispiel für kritische Systemintegrität im iDRAC9-Dashboard.
Tabelle 1: Beispiel für ein System Ereignisprotokoll (SEL)
2020-06-02 07:08:15 |
2 |
Kein Zugriff auf die Front-LED-Anzeige möglich aufgrund eines Hardwarefehlers. |
Tabelle 2: Beispiel für Lifecycle-Protokoll
2020-06-02 07:08:15 |
677 |
SWC5008 |
Kein Zugriff auf die Front-LED-Anzeige möglich aufgrund eines Hardwarefehlers. |
Das LED-Bedienfeld vorne links wird von dem in PowerEdge-Servern eingebetteten iDRAC (BMC)-Controller überwacht und verwaltet. Regelmäßige Statusabfragen werden alle fünf Sekunden durchgeführt, um das Vorhandensein und den aktuellen Funktionszustand der vorderen LED-Anzeige zu überprüfen. Der iDRAC speichert außerdem die aktuelle installierte Firmware auf dieser Controller-Platine. Wenn eine anwendbare Aktualisierung in der iDRAC-Firmware vorhanden ist, versucht der iDRAC, die LED-Firmwareaktualisierung während der iDRAC-Startzyklen zu übertragen. In einer dieser Sequenzen verwendet der iDRAC einen I2C-Bus für die Kommunikation mit dieser LED-Controller-Platine. Timeouts in der Kommunikation zwischen iDRAC und dem linken Bedienfeld während dieser Sequenzen führen dazu, dass die SWC5008-Fehlerereignisse im SEL und im Lifecycle-Protokoll protokolliert werden.
Abbildung 2: Front-LED-Bedienfeld PowerEdge R740XD
Das linke Bedienfeld (LCP) dient der direkten Verwaltung am System und bietet schnellen Überblick über die Systemintegrität. Es befindet sich von vorne betrachtet an der linken Seite des Gehäuses.
Bei den meisten PowerEdge-Servern wird das LCP mit zwei Optionen angeboten:
In jeder dieser Bedienfeldkonfigurationen gibt es fünf Status-LED-Anzeigen, die am Gerät in Echtzeit einen Hardwarefehler des Servers anzeigen. Eine Erläuterung dieser Anzeige-LEDs ist unten in Abbildung 3 zu sehen.
Abbildung 3: LED-Funktionszustandsanzeigen – PowerEdge
Unter normalen Serverzustandsbedingungen scheinen diese fünf LEDs ausgeschaltet zu sein.
Wenn ein Hardwarefehler auf einem der Subsysteme erkannt wird, die auf diese LEDs ausgerichtet sind, leuchtet die Hintergrundbeleuchtung stetig gelb.Diese LEDs werden durch den iDRAC (BMC)-Controller per Kommunikation über den I2C-Bus gesteuert. Die Lichtleisten für Quick Sync und System-ID werden nicht über denselben i2c-Bus angesprochen und arbeiten unabhängig von den Status-LEDs.
Mit der iDRAC9-Firmwareversion 4.22.00.53 wurden Mechanismen zur Wiederherstellung der LED-Controller der Frontblende aus einem Soft-Lockup-Zustand eingeführt. Diese Änderungen sind in allen iDRAC9-Versionen ab 4.32.10.00 enthalten. Die in dieser Version enthaltenen Änderungen verschleiern keine echten Hardwarefehler der Front-LED-Bedienfeld. Wenn nach der Implementierung dieser Firmware weiterhin Fehler auftreten, fahren Sie mit der Fehlersuche an der Hardware fort.
Wenn nach Anwendung der iDRAC9-Firmware 4.22.00.53 oder 4.32.10.00 weiterhin SWC5008-Ereignisse aufgezeichnet werden, sollte die vordere LED-Anzeige auf einen möglichen Hardware-Fehler untersucht werden. Die folgenden Schritte zum Troubleshooting sollten als Ausgangspunkt betrachtet werden: