現象
Lors de la mise à niveau, le cluster devient inaccessible aux utilisateurs finaux. Le cluster indique que plusieurs nœuds sont arrêtés et se divisent en raison de l’état de lecture seule (RO). Les logs indiquent que les nœuds ne peuvent plus communiquer avec l’iDRAC. Ils sont donc en cours de définition pour le RO. Les opérations du système de fichiers peuvent être suspendues ou abandonnées en raison de blocages, d’expirations de délai ou de perte de quorum.
原因
Au cours du processus de mise à niveau, si la version du firmware de l’iDRAC est en cours de mise à jour, l’iDRAC redémarre dans le cadre du processus. Il existe une fenêtre d’environ trois minutes pendant laquelle l’iDRAC est inaccessible. Cela empêche la surveillance de l’intégrité du matériel, de sorte que le nœud est défini en lecture seule jusqu’à ce que l’iDRAC revienne en ligne. Le moteur de mise à niveau suit l’état de la mise à niveau dans chaque voisinage en fonction des réservations de pools de disques. Lorsque le nœud est défini sur RO lors du redémarrage de l’iDRAC, cela annule sa réservation de pool de disques existante. Une fois la réservation libérée, le moteur de mise à niveau lance la mise à niveau sur le nœud suivant dans le voisinage. Cela entraîne le démarrage de la mise à niveau d’un nombre progressivement plus important de nœuds, jusqu’à ce que le cluster soit coincé.
解決方法
Si vous avez rencontré ce problème, contactez le
support technique Dell en lui communiquant l’ID de cet article de la base de connaissances.
Le correctif permanent pour ce problème se trouve dans la version actuelle de OneFS. Ce document
ne s’applique pas si vous exécutez :
- OneFS 9.4.0.19 et versions ultérieures
- OneFS 9.5.0.9 et au-delà
- OneFS 9.7.1.0 et versions ultérieures
- OneFS 9.8.0.1 et au-delà
Pour les versions antérieures de OneFS, les clusters dotés de matériel Gen6.5 utilisent uniquement le commutateur roulant lors de l’exécution de toute mise à niveau qui inclut le package de firmware de nœud. La limitation de la mise à niveau parallèle est spécifique au moment où vous appliquez le firmware. Voici quelques exemples de commandes :
# isi upgrade cluster start --parallel /ifs/data/OneFS_v9.5.0.7_LTS2023_V2_Install.isi (safe command as it does not include the node firmware package)
# isi upgrade firmware start --rolling --fw-pkg=/ifs/data/Isi_Fw_Package_v12.0.tar (safe command as you are doing a rolling upgrade)
# isi upgrade firmware start --parallel --fw-pkg=/ifs/data/Isi_Fw_Package_v12.0.tar (could induce DU as you are doing a firmware update with the parallel option)
# isi upgrade cluster start --parallel /ifs/data/OneFS_v9.5.0.7_LTS2023_V2_Install.isi --fw-pkg=/ifs/data/Isi_Fw_Package_v12.0.tar (could induce DU as you are including firmware in a parallel upgrade)
対象製品
PowerScale F200, PowerScale F600, PowerScale F900