Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

PowerStore: Während der Installation des Assistenten für die Erstkonfiguration (ICW) oder beim Hinzufügen einer Appliance zu einem vorhandenen Cluster schlägt die Aufgabe mit "Unconfigured Faulted" fehl.

Summary: Während der Installation des Assistenten für die Erstkonfiguration (ICW) oder beim Hinzufügen einer Appliance zu einem vorhandenen Cluster schlägt die Aufgabe mit "Unconfigured Faulted" fehl. ...

This article applies to This article does not apply to This article is not tied to any specific product. Not all product versions are identified in this article.

Symptoms

Problem

Während der Erstinstallation einer Appliance in einem neuen Cluster oder beim Hinzufügen einer neuen Appliance zu einem vorhandenen Cluster können Hardware- und Netzwerkprüfungen fehlschlagen, die den Status der Appliance von "Unconfigured" in "Unconfigured Faulted"ändern können. Dieser Status bedeutet, dass die Appliance keinem neuen Cluster beitreten oder zu einem vorhandenen Cluster hinzugefügt werden kann.  Der Fehler muss behoben werden, bevor die Appliance zu einem Cluster hinzugefügt werden kann.



Cause

 

Resolution


Ursache

Um festzustellen, ob ein Hardware- oder Netzwerkproblem vorliegt, das die Bedingung "Unconfigured Faulted" verursacht, führen Sie die folgenden Schritte aus:

Wenn Sie die Appliance zu einem vorhandenen Cluster hinzufügen (über PowerStore Manager):

  1. Greifen Sie mithilfe der Service-LAN-Port-Zugriffsmethode auf das System zu (siehe PowerStore: Zugriff auf einen Node für Details).
  2. Führen Sie nach der Anmeldung beim Servicecontainer als Servicenutzer das folgende Serviceskript aus, um festzustellen, ob ein Hardware- oder Netzwerkproblem vorliegt:

    svc_diag list --icw_hardware
    svc_diag list --network
     
  3. Wenn keine Fehler oder Probleme gemeldet werden, ist es möglich, dass die ursprünglichen Symptome während des ICW- oder Hinzufügen-Appliance-Vorgangs vorübergehend waren.
     
  4. Wenn ein Fehler oder Problem angezeigt wird und Sie nicht ermitteln können, wie sie behoben werden sollen, führen Sie das folgende Skript aus, um eine Datenerfassung zu erstellen, und wenden Sie sich an Ihren Serviceanbieter, um Unterstützung zu erhalten:

    svc_dc run
     
  5. Wenn Sie eine Appliance auf einem neuen Cluster installieren und bereit sind, die Installation erneut zu versuchen:
    • Schließen Sie Das Ermittlungstool und/oder den Browser. 
    • Starten Sie das Discovery Tool neu oder öffnen Sie den Browser mit der statischen Service-LAN-IP-Adresse für Node A [d. h. 128.221.1.252].
    • Wenn das System anzeigt, dass es sich im Status "Unconfigured" befindet, setzen Sie die Erstkonfigurations-/ICW-Schritte fort.
    • Wiederholen Sie den Vorgang Add Appliance, um festzustellen, ob die Aufgabe erfolgreich ist.
       
  6. Falls die Aufgabe weiterhin fehlschlägt, führen Sie eine Datenerfassung durch, um relevante Protokolle zu erhalten, und wenden Sie sich an Ihren Serviceanbieter, um Unterstützung zu erhalten.

Im Folgenden finden Sie ein Beispiel für eine erfolgreiche Ausgabe von svc_diag list --icw_hardware " " in der linken Spalte. Die rechte Spalte enthält Erklärungen zu Fehlern, die möglicherweise angezeigt werden.

Beispielausgabe

Beschreibung

hw_type Warnado-EX
wird auf Node A ausgeführt

 

FRU-Status von Node A

OK | Peer-Node-| 0x0f80 OK
| Lokale Node-| 0x1480 OK
| Integrierte Modul-| 0x8b81
OK | 4-Port-Karte | 0x8b81
OK | E/A-Modul 0 | 0x8b81 OK
| E/A-Modul 1 | 0x8b81 OK
| Internes Backupakkumodul | 0x3380

FRU-Status auf Node B
OK | Peer-Node-| 0x0f80 OK
| Lokale Node-| 0x1580 OK
| Integrierte Modul-| 0x8b81
OK | 4-Port-Karte | 0x8b81
OK | E/A-Modul 0 | 0x8b81 OK
| E/A-Modul 1 | 0x8b81 OK
| Internes Backupakkumodul | 0x1380

Diese Tabellen bestehen aus drei Spalten:

 

Zusammenfassung | FRU-Name | Wert des Statussensors

 

Die Spalte Zusammenfassung auf der linken Seite sollte wie folgt gelesen werden:

 

OK = FRU-Status ist gut

 

Leer = FRU fehlt und/oder wird von der Appliance nicht erkannt. Da E/A-Module optional sind, kann es normal sein, dass der Status "Empty" für E/A-Module angezeigt wird. (In diesem Fall müssen die gleichen E/A-Modulsteckplätze auf beiden Nodes leer sein.) Alle anderen FRUs sind erforderliche Hardware und sollten immer "OK" sein.

 

Aus = FRU ist ausgeschaltet. FRU muss möglicherweise ausgetauscht werden.

 

Unbekannt = Statussensorwert enthält unerwartete Werte. FRU muss möglicherweise ausgetauscht werden.

 

Empfohlene Maßnahme für einen Fehler: Lesen Sie die zugehörigen KB-Artikel, um Details zur Behebung dieser Hardwareprobleme zu erhalten. Dazu gehören: SLN317238/SLN320677 (Nodes), SLN317221 (E/A-Module, Karte mit 4 Ports) und SLN320676 (integriertes Modul).

E/A-Modul-Konsistenzprüfung = Erfolgreich

Node-Konsistenzprüfung = Erfolg

Akkuprüfung = OK

Bei diesen Prüfungen werden die Werte der FRU-Statuszusammenfassung von jedem Node verglichen. Es wird erwartet, dass beide Nodes denselben Zusammenfassungswert für jede FRU melden.

Empfohlene Maßnahme für einen Fehler:

  1. Informationen zu E/A-Modulen finden Sie im KB-Artikel SLN317221.
  2. Informationen zu Nodes finden Sie in den KB-Artikeln SLN317238/SLN320677.
  3. Die Überprüfung des internen Backupakkumoduls ist immer in Ordnung, es sei denn, der FRU-Status kann nicht von einem oder beiden Nodes gelesen werden. Wenn dies der einzige Fehler ist, der vom befehl icw_hardware gemeldet wird, sollte der Neustart des ICW dies zulassen.

Fehlerstatusregisterstatus von Node A = Erfolg
OK | Node
OK | Integriertes Modul
OK | Internes Backupakku-Modul

OK | DIMM00
OK | DIMM01
OK | DIMM02
OK | DIMM03
OK | DIMM04
OK | DIMM05
OK | DIMM06
OK | DIMM07
OK | DIMM08
OK | DIMM09
OK | DIMM10
OK | DIMM11
OK | DIMM12
OK | DIMM13
OK | DIMM14
OK | DIMM15
OK | DIMM16
OK | DIMM17
OK | DIMM18
OK | DIMM19
OK | DIMM20
OK | DIMM21
OK | DIMM22
OK | DIMM23
OK | E/A-Modul 0
OK | E/A-Modul 1
OK | 4-Port-Karte

Node B Fehlerstatusregisterstatus = Erfolg
OK | Node
OK | Integriertes Modul
OK | Internes Backupakku-Modul

OK | DIMM00
OK | DIMM01
OK | DIMM02
OK | DIMM03
OK | DIMM04
OK | DIMM05
OK | DIMM06
OK | DIMM07
OK | DIMM08
OK | DIMM09
OK | DIMM10
OK | DIMM11
OK | DIMM12
OK | DIMM13
OK | DIMM14
OK | DIMM15
OK | DIMM16
OK | DIMM17
OK | DIMM18
OK | DIMM19
OK | DIMM20
OK | DIMM21
OK | DIMM22
OK | DIMM23
OK | E/A-Modul 0
OK | E/A-Modul 1
OK | 4-Port-Karte

Die Statuswerte in der linken Spalte sind OK oder FLT. Diese werden aus dem Fehlerstatusregister (FSR) gelesen.

 

Ein "FLT" gibt an, dass die FRU einen Hardwarefehler verursacht hat.

 

Ein "OK" bedeutet, dass für diese FRU kein Hardwarefehler aufgezeichnet wird. Wenn keine FRU vorhanden ist, sollte der Status in dieser Tabelle "OK" sein. (Ein leerer E/A-Modulsteckplatz wird in diesen Tabellen als "OK" angezeigt, aber in der tabelle "FRU-Status" oben als "Leer" aufgeführt.)

 

Empfohlene Maßnahme für einen Fehler:  Suchen Sie nach zugehörigen Wissensdatenbank-Artikeln zur Behebung von Hardwareproblemen. Dazu gehören: SLN317238/SLN320677 (Nodes), SLN317213 (internes Backupakkumodul), SLN317221 (E/A-Module, Karte mit 4 Ports) und SLN320676 (integriertes Modul).

NVRAM-Cachelaufwerke
Node-Core-Anzahl (NodeA: 12, NodeB: 12)
Anzahl der erforderlichen NVRAM-Laufwerke basierend auf der Core-Anzahl: 2
NVRAM-Laufwerke gefunden (NodeA:2, NodeB:2)
NVMe-Speicherlaufwerke
Anzahl der erforderlichen NVMe-Laufwerke: 6
SCM-Laufwerke gefunden (NodeA: 0, NodeB: 0)
SSD-Laufwerke gefunden (NodeA: 12 (NVMe 6, SAS 6), NodeB: 12 (NVMe 6, SAS 6))
NVMe Drive Check = Success
compareNodeDrives – NVEe Drive Counts, NodeA 8, NodeB 8
im Vergleich NodeDrives – beide Nodes sehen dieselben NVMe-Laufwerke
im VergleichNodeDrives – SAS SSD Drive Counts, NodeA 12, NodeB 12
compareNodeDrives – beide Nodes sehen dieselben Laufwerke
Vergleich Node Drive Check = Success
checkExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2
Enclosure Check = Success

Laufwerksbezogene Prüfungen umfassen:
1.    Die Appliance muss die richtige Anzahl von NVRAM-Cachelaufwerken enthalten (die spezifische Anzahl hängt vom Modell der Appliance ab). Empfohlene Maßnahme, wenn dies einen Fehler anzeigt: Suchen Sie nach fehlenden, fehlerhaften oder nicht ordnungsgemäß eingesetzten NVRAM-Laufwerken. Die Ausgabe des Befehls "svc_diag list --nvme_drive" kann hilfreich sein.

2.    Die Datenlaufwerke im System müssen den offiziellen Konfigurationsregeln für SCM-, SCD- und SAS-Laufwerke folgen (in diesem Beispiel gibt es keine SCM-Laufwerke in der Appliance). Empfohlene Maßnahme, wenn dies einen Fehler anzeigt: Überprüfen Sie die Laufwerksbezeichnungen aller NVMe- und/oder SAS-Laufwerke. Wenn eine Mischung aus SCM- und SSD-Laufwerkstypen vorhanden ist, ersetzen oder entfernen Sie die Laufwerke nach Bedarf.

3.    Die gleiche Anzahl von Laufwerken muss von beiden Nodes sichtbar sein (ein Laufwerk, das nur von einem Node sichtbar ist, führt zu Problemen). Empfohlene Maßnahme, wenn dies einen Fehler anzeigt: Sie können "svc_diag list --nvme_drive" verwenden, um detaillierten Status über NVMe-Laufwerke anzuzeigen, um zu ermitteln, welches Laufwerk oder welche Laufwerke nur auf einem Node sichtbar sind.

4.    Die gleiche Anzahl von Laufwerksgehäusen muss von beiden Nodes sichtbar sein (ein Gehäuse, das nur von einem Node sichtbar ist, führt zu Problemen). Empfohlene Maßnahme, wenn dies einen Fehler anzeigt: Überprüfen Sie alle Gehäusekabel und stellen Sie sicher, dass die Gehäuse ordnungsgemäß verkabelt sind.

checkIoms – nodeAIoms: [u' 303-321-000C', u' 313-202-000B']
checkIoms – nodeBIoms: [u' 303-321-000C', u' 313-202-000B']
Node-EAM-Prüfung vergleichen = Erfolg

Das E/A-Modul in jedem Steckplatz auf einem Node muss mit dem E/A-Modul im selben Steckplatz auf dem Peer-Node übereinstimmen.

 

Dies kann passieren, wenn die falsche Art von I/O-Modul in einem Node vorhanden ist oder wenn jeder Node ein E/A-Modul enthält, sich aber in verschiedenen Steckplätzen befindet (Beispiel: Steckplatz 0 auf einem Node, aber Steckplatz 1 auf dem Peer-Node). Sie können hier auch einen Fehler sehen, wenn ein E/A-Modul fehlt oder ausgeschaltet ist (siehe Abschnitt "Fehlerstatusregister" oben).

 

Empfohlene Maßnahme für einen Fehler: Vergleichen Sie die Teilenummern der E/A-Module in beiden E/A-Modulsteckplätzen auf beiden Nodes. Wenn Es zu Inkonsistenzen kommt, verschieben oder ersetzen Sie die E/A-Module nach Bedarf, um das Problem zu beheben. KB SLN317221 kann ebenfalls hilfreich sein.

GESAMTSTATUS: True, return_code 0
EAM Consistency Check: Konsistenzprüfung des
Success Node: Erfolgsprüfung
des Akkus: OK
Fehlerstatus Register A:
Erfolgsfehlerstatusregister B: Success
Node A Accessible: Echter
Node B Zugänglich: Echte
Laufwerksprüfung: Vergleichsprüfung
für Erfolgs-Node-Laufwerke: Erfolgsprüfung
des Gehäuses: Success
IO Module Vergleichsprüfung: Success

Dieser Abschnitt enthält eine Zusammenfassung der oben bereitgestellten Informationen.


Im Folgenden finden Sie ein Beispiel für eine erfolgreiche Ausgabe von " svc_diag_list --network" :

Beispielausgabe

Minimale Verkabelungsprüfung starten *)*
OCP_MEZZ 0 auf Node A LINK_STATUS_UP
ist, OCP_MEZZ 0 auf Node B LINK_STATUS_UP
ist OCP_MEZZ 1 auf Node A OCP_MEZZ 1 auf Node B LINK_STATUS_UP ist LINK_STATUS_UP *
minimale
Verkabelungsprüfung: Gesamtfehler: 0
Gesamtfehler: 0, Rückgabecode: 0




 


 

Affected Products

PowerStore
Article Properties
Article Number: 000139935
Article Type: Solution
Last Modified: 11 Aug 2021
Version:  5
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.