Sorun
Bir cihazın yeni bir Kümeye ilk kurulumu sırasında veya mevcut bir Kümeye yeni bir cihaz eklenirken başarısız olabilecek donanım ve ağ denetimleri bulunur. Bu da cihazın durumunu "Unconfigured" (Yapılandırılmamış) olarak "Unconfigured Faulted"(Yapılandırılmamış Hatalı) olarak değiştirebilir. Bu durum, cihazın yeni bir kümeye katılayamayyağı veya mevcut bir kümeye eklenilemeytiği anlamına gelir. Cihaz bir kümeye eklenebilir önce arıza temizlenir.
Neden
"Unconfigured Faulted" (Yapılandırılmamış Arızalı) durumuna neden olan bir donanım veya ağ sorunu olup olmadığını belirlemek için aşağıdaki adımları uygulayın:
Cihazı mevcut bir Kümeye eklüyorsanız (PowerStore Manager'dan):
- Servis LAN bağlantı noktası erişim yöntemini kullanarak sisteme erişin (Bkz. PowerStore: Ayrıntılar için bir Düğüme erişme).
- Servis kapsayıcısına servis kullanıcısı olarak oturum açtıkten sonra, bir donanım veya ağ sorunu olup olmadığını belirlemek için aşağıdaki Servis komut dosyasını çalıştırın:
svc_diag list --icw_hardware
svc_diag list --network
- Herhangi bir hata veya sorun bildirilmezse ICW veya cihaz ekleme işlemi sırasında görülen orijinal belirtiler geçici olabilir.
- Bir hata veya sorun gösterilirse ve nasıl çözüleceklerini belirleyemezse Veri Toplama işlemi için aşağıdaki komut dosyasını çalıştırın ve yardım için Servis Sağlayıcınızla iletişime geçin:
svc_dc run
- Yeni bir kümeye bir cihaz yüklemeli ve kurulumu yeniden denemeye hazırsanız:
- Keşif Aracınızı ve/veya tarayıcınızı kapatın.
- Discovery Tool'u yeniden başlatın veya tarayıcıyı Düğüm A için statik Servis LAN IP adresiyle açın [ör. 128.221.1.252].
- Sistem , "Unconfigured" (Yapılandırılmamış) durumda olduğunu gösterirse ilk yapılandırma/ICW adımlarınıza devam edin
- İşlemin başarılı olduğunu görmek için Add Appliance (Cihaz Ekle) işlemini yeniden deneyin.
- Görev hala başarısız olursa ilgili günlükleri almak için bir Veri Toplama işlemi gerçekleştirin ve yardım için Servis Sağlayıcınızla iletişime geçin.
Aşağıda, sol sütundaki " " dan svc_diag list --icw_hardware
başarılı bir çıktı örneği verilmiştir; sağ sütunda, görebilirsiniz hataların açıklamaları bulunur.
Örnek Çıktı |
Açıklama |
hw_type Düğüm A'da Çalışan Warnado-EX
|
|
Düğüm A FRU Durumu Tamam | Eş Düğüm | 0x0f80 tamam | Yerel Düğüm | 0x1480 Tamam | Yerleşik Modül | 0x8b81 4 bağlantı noktalı | kartında sorun | 0x8b81 sorun | G/Ç Modülü 0 | 0x8b81 tamam | G/Ç Modülü 1 | 0x8b81 Tamam | Dahili Yedek Pil Modülü | 0x3380 Düğüm B FRU Durumu Tamam | Eş Düğüm | 0x0f80 tamam | Yerel Düğüm | 0x1580 tamam | Yerleşik Modül | 0x8b81 4 bağlantı noktalı | kartında sorun | 0x8b81 sorun | G/Ç Modülü 0 | 0x8b81 Tamam | G/Ç Modülü 1 | 0x8b81 Tamam | Dahili Yedek Pil Modülü | 0x1380 |
Bu tablo üç sütundan oluşur: Özet | FRU Adı | Durum Sensörü değeri Sol tarafta bulunan Summary (Özet) sütunu aşağıdaki şekilde okunmalı: Tamam = FRU durumu iyi Boş = FRU eksik ve/veya cihaz tarafından algılanmadı. G/Ç Modülleri isteğe bağlı olduğundan G/Ç Modülleri için "Boş" durumunu görmek normal olabilir. (Bu durumda, her iki düğümde de aynı G/Ç Modülü yuvaları Boş bırakılmalıdır). Diğer tüm FRU'lar donanım gerektirir ve her zaman "TAMAM" olmalıdır. Kapalı = FRU kapalı. FRU'ların değiştirilmesi gerekir. Bilinmeyen = Durum Sensörü değeri beklenmeyen değerler içerir. FRU'ların değiştirilmesi gerekir. Arıza için Önerilen Eylem: Bu donanım sorunlarının nasıl çözüleceğinin ayrıntıları için ilgili KB makalelerine başvurun. Bunlar şunları içerir: SLN317238/SLN320677 (Düğümler), SLN317221 (G/Ç Modülleri, 4 Bağlantı Noktalı Kart) ve SLN320676 (Yerleşik Modül). |
GÇ Modülü Tutarlılık Denetimi = Başarılı Düğüm Tutarlılık Denetimi = Başarılı Pil Kontrolü = Tamam |
Bu kontroller, her düğümdeki FRU Durum Özeti değerlerini karşılar. Her iki düğümün de her FRU için aynı Özet değerini bildirmesi beklenir. Arıza için Önerilen Eylem:
- G/Ç Modülleri için SLN317221 kb makalesine başvurun.
- Düğümler için SLN317238/SLN320677 numaralı KB makalelerine başvurun.
- FRU durumu bir veya her iki düğümden okunamadıkça Dahili Yedek Pil Modülü denetimi her zaman iyi durumda olur. icw_hardware komutu tarafından bildirilen tek hata buysa ICW'nun yeniden başlatılmasının başarılı olması gerekir.
|
Düğüm A Arıza Durumu Kayıt Durumu = Başarılı | Düğüm Tamam | Yerleşik Modül Tamam | Dahili Yedek Pil Modülü Modülü tamam | DIMM00 Tamam | DIMM01 Tamam | DIMM02 Tamam | DIMM03 Tamam | DIMM04 Tamam | DIMM05 Tamam | DIMM06 Tamam | DIMM07 Tamam | DIMM08 Tamam | DIMM09 Tamam | DIMM10 Tamam | DIMM11 Tamam | DIMM12 Tamam | DIMM13 Tamam | DIMM14 Tamam | DIMM15 Tamam | DIMM16 Tamam | DIMM17 Tamam | DIMM18 Tamam | DIMM19 Tamam | DIMM20 Tamam | DIMM21 Tamam | DIMM22 TAMAM | DIMM23 Tamam | G/Ç Modülü 0 Tamam | G/Ç Modülü 1 Tamam | 4 Bağlantı Noktalı Kart Düğüm B Arıza Durumu Kayıt Durumu = Başarılı | Düğüm Tamam | Yerleşik Modül Tamam | Dahili Yedek Pil Modülü Modülü tamam | DIMM00 Tamam | DIMM01 Tamam | DIMM02 Tamam | DIMM03 Tamam | DIMM04 Tamam | DIMM05 Tamam | DIMM06 Tamam | DIMM07 Tamam | DIMM08 Tamam | DIMM09 Tamam | DIMM10 Tamam | DIMM11 Tamam | DIMM12 Tamam | DIMM13 Tamam | DIMM14 Tamam | DIMM15 Tamam | DIMM16 Tamam | DIMM17 Tamam | DIMM18 Tamam | DIMM19 Tamam | DIMM20 Tamam | DIMM21 Tamam | DIMM22 TAMAM | DIMM23 Tamam | G/Ç Modülü 0 Tamam | G/Ç Modülü 1 Tamam | 4 Bağlantı Noktalı Kart |
Sol sütundaki durum değerleri OK (Tamam) veya FLT (FLT) olarak ayarlanır. Bunlar, Arıza Durumu Kaydından (FSR) okunur. "FLT", FRU'da bir donanım hatası alınıp alınamaması olduğunu gösterir. "Ok" (Tamam) ifadesi, bu FRU için herhangi bir donanım hatasının kaydedilene kadar olmadığını gösterir. FRU mevcut değilse bu tablodeki durum "Tamam" olmalıdır. (Bu tablolarda boş bir G/Ç Modülü yuvası "Tamam" olarak gösterilir ancak yukarıdaki FRU Durumu tablosunda "Boş" olarak listelenir.) Arıza için Önerilen Eylem: Donanım sorunlarının çözümü için ilgili Knowledge Base makalelerini arama. Bunlar şunları içerir: SLN317238/SLN320677 (Düğümler), SLN317213 (Dahili Yedek Pil Modülü), SLN317221 (G/Ç Modülleri, 4 Bağlantı Noktalı Kart) ve SLN320676 (Yerleşik Modül). |
NVRAM Önbellek Sürücüleri Düğüm Çekirdek Sayısı (NodeA:12, NodeB:12) Çekirdek Sayısına bağlı olarak gerekli NVRAM Sürücüleri sayısı: 2 NVRAM Sürücüsü Bulundu (NodeA:2, NodeB:2) NVMe Depolama Sürücüleri Gerekli NVMe Sürücüleri Sayısı: 6 SCM Sürücü Bulundu (DüğümA: 0, Düğüm B: 0) Bulunan SSD Sürücüleri (DüğümA: 12 (NVMe 6, SAS 6), DüğümB: 12 (NVMe 6, SAS 6)) NVMe Sürücü Kontrolü = Başarılı karşılaştırmaNodeDrives - NVEe Sürücü Sayısı, NodeA 8, NodeB 8 compareNodeDrives (Düğüm 8 ileNodeDrives karşılaştırması) - Her iki Düğüm de aynı NVMe sürücülerini karşılaştırdı - SAS SSD Sürücü Sayısı, NodeA 12, NodeB 12 compareNodeDrives - Her iki Düğüm de aynı sürücüleri görmek Düğüm Sürücüsü Denetimi
Karşılaştırması = Başarı kontrolüExpansionEnclosures - nodeAEnclCount 2, nodeBEnclCount 2 Muhafaza Kontrolü = Başarı |
Sürücüyle ilgili kontroller şunları içerir: 1. Cihaz, doğru SAYıDA NVRAM Önbellek sürücüsü içermelidir (belirli numara, cihazın modeline bağlıdır). Bu bir hata gösteriyorsa Önerilen Eylem: Eksik, hatalı veya yanlış takılmış NVRAM sürücülerini bulun. "svc_diag list --nvme_drive" komutunun çıktısı faydalı olabilir. 2. Sistemdeki veri sürücüleri SCM, SCD ve SAS sürücüleri için resmi yapılandırma kurallarına uygun olmalıdır (bu örnekte, cihaz içinde SCM sürücüsü yok). Bu bir hata gösteriyorsa Önerilen Eylem: Tüm NVMe ve/veya SAS sürücülerinin sürücü etiketlerini kontrol edin. SCM ve SSD sürücü türlerinin karışımı varsa sürücüleri gerekli şekilde değiştirin veya çıkarın. 3. Her iki düğümden aynı sayıda sürücü görünür durumdadır (yalnızca bir düğümden görünen bir sürücü sorunlara neden olur). Bu bir hata gösteriyorsa Önerilen Eylem: HANGI sürücünün veya sürücülerin yalnızca bir düğümde svc_diag olduğunu belirlemek için NVMe sürücüleri hakkında ayrıntılı durumu görüntülemek için "svc_diag list --nvme_drive" komutunu kullanın. 4. Aynı sayıda sürücü muhafazası her iki düğümden de görülebilir (yalnızca bir düğümden görülen bir muhafaza sorunlara neden olur). Bu bir hata gösteriyorsa Önerilen Eylem: Tüm muhafaza kablolarını kontrol edin ve muhafazaların düzgün şekilde kablolanmış olduğundan emin olun. |
checkIoms - nodeAIoms: [u' 303-321-000C', u' 313-202-000B'] checkIoms - nodeBIoms: (checkIoms - nodeBIoms: (checkIoms - düğüm BIom' [u' 303-321-000C', u' 313-202-000B'] Düğüm IOM Denetimi karşılaştırması = Başarılı |
Bir düğümdeki her yuvadaki G/Ç Modülü, eş düğümdeki aynı yuvadaki G/Ç Modülü ile eşleşmelidir. Bu durum, bir düğümde yanlış G/Ç Modülü varsa veya her düğüm bir G/Ç Modülü içerir ancak bunlar farklı yuvalardaysa (örneğin: bir düğümde yuva 0, eş düğümdeki yuva 1) olabilir. Bir G/Ç Modülü eksik veya kapalıysa burada bir arıza da görebilirsiniz (yukarıdaki "Arıza Durumu Kaydı" bölümüne bakın). Arıza için Önerilen Eylem: Her iki düğümdeki her iki G/Ç Modülü yuvasındaki G/Ç Modüllerinin parça numaralarını karşılaştırın. Herhangi bir tutarsızlık varsa sorunu düzeltmek için G/Ç Modüllerini gerektiği şekilde hareket ettirin veya değiştirin. KB SLN317221 de faydalı olabilir. |
GENEL DURUM: Doğru, return_code 0 IOM Tutarlılık Denetimi: Başarılı Düğüm Tutarlılık Denetimi: Başarılı Pil Kontrolü: Tamam Hata Durumu Kaydı A: Başarılı Arıza Durumu Kaydı B: Başarılı Düğüm A Erişilebilir: True Node B Accessible (Gerçek Düğüm B Erişilebilir): Doğru Sürücü Denetimi: Başarılı Düğüm Sürücüleri Karşılaştırma Kontrolü: Başarılı Muhafaza Kontrolü: Başarılı GÇ Modülü Karşılaştırma Kontrolü: Başarı |
Bu bölüm, yukarıda verilen bilgilerden bir özettir. |
Aşağıda, ":" komutundan başarılı bir çıktı örneği svc_diag_list --network"
verilmiştir:
Örnek Çıktı |
Minimum kablolama kontrolüne başlayın **** OCP_MEZZ 0, Düğüm OCP_MEZZ A LINK_STATUS_UP'de LINK_STATUS_UP Düğüm B'de OCP_MEZZ düğüm A'da LINK_STATUS_UP düğüm B'de OCP_MEZZ 1 LINK_STATUS_UP
**** Minimum kablolama kontrolü: Genel hatalar: 0 Genel hatalar: 0, dönüş kodu: 0 |