# isi_gather_info
# isi_gather_info
*執行狀況檢查並非為了修正叢集問題,或評估叢集的組態、效能或工作流程。
isi config shutdown <node_lnn>
isi status -q
命令,然後在輸出的「運行狀況 DASR」 列中查找 “確定 ”。選取了問題的範例。節點 1 已成功重新加入群集,但“運行狀況 DASR”列指示它需要注意。
mycluster-1# isi status -q Cluster Name: mycluster Cluster Health: [ ATTN] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-A-- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi status -q
isi config reboot <node_lnn>
但是, Dell 強烈建議 使用冷重新開機方法,更有效地識別潛在的硬體問題。
第 2 階段:關閉叢集中的每個節點。
這些步驟會在您關閉 Isilon 叢集的當天執行。在全叢集關機期間,某些因素可能會影響或延遲關機程序。例如,對節點的未完成數據寫入可能會影響關閉。步驟 1-2 的目的是確保在執行 shutdown 命令之前,所有用戶端都已從叢集中斷連線,且節點日誌中的資料已正確儲存至檔案系統。如果您有 iSCSI 用戶端,請務必在停用 iSCSI 服務前關閉用戶端。
步驟 3 介紹如何使用串行控制台按順序關閉群集中的每個節點。建議使用此方法,因為它使您能夠在繼續下一個節點之前驗證每個節點是否正確關閉,並根據需要進行調整或修復問題以確保群集正確關閉。但是,此方法可能很耗時,因為它需要將串行主控台連接到每個節點以運行關閉命令。同時關閉叢集中的所有節點章節說明如何使用 OneFS 命令列介面或 OneFS Web 管理介面來關閉叢集。此方法比步驟 3 耗時少,但使得識別在關機過程中遇到問題的節點更具挑戰性。
isi services apache2 isi services isi_hdfs_d isi services isi_iscsi_d isi services ndmpd isi services nfs isi services smb isi services vsftpd
mycluster-4# isi services smb Service 'smb' is enabled. mycluster-4# isi services nfs Service 'nfs' is disabled. mycluster-4#
isi services apache2 disable isi services isi_hdfs_d disable isi services isi_iscsi_d disable isi services ndmpd disable isi services nfs disable isi services smb disable isi services vsftpd disable
如果您有 iSCSI 用戶端,請確定 iSCSI 用戶端已在執行步驟 2 前取消掛接其 LUN。執行 isi iscsi list
命令,確認所有 iSCSI 用戶端都已與群集斷開連接。
isi_iscsi_d disable
命令。掛接的 iSCSI LUN 中斷可能會導致用戶端受損,這通常需要從備份復原。
isi_for_array isi_flush
命令。每個節點上都會顯示類似於以下內容的輸出:mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... mycluster-1: Cache flushing complete.
mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... vinvalbuf: flush failed, 1 clean and 0 dirty bufs remaining mycluster-2: Flushing cache... fsync: giving up on dirty
執行 isi_for_array isi_flush
再次命令。若有任何節點無法排清,請聯絡 Dell Isilon 技術支援。所有節點都必須成功排清,才能繼續下一個步驟。
isi_for_array shutdown -p
命令以關閉群集。
isi config shutdown
Powering the system off using ACPI
2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Attempting to save journal to default location 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Saving journal to /var/journal/journal.gz 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: All data saved successfully 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: Attempting to save journal to default location 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: A valid backup journal already exists. Not saving. An example of a node journal save failure is highlighted in the output below: 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: ERROR: Validation failed for backup journal. Shutdown aborted 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: Failed command output:
如果收到節點日誌未保存的錯誤,可以通過執行 階段 3 中的步驟手動保存日誌。
如果發生緊急情況,您可以同時關閉集群中的所有節點。但是,不建議使用此方法,因為它無法讓您在發生問題時監視每個節點的狀態和輸出。如果您選擇執行這些步驟,Dell 強烈建議您遵循 第 3 階段 的所有步驟,以驗證在執行下列程序後,所有節點是否已正確關機。
# isi config shutdown all
isi_for_array shutdown -p
命令以從 OneFS Web 管理介面關閉您的叢集 - 在 OneFS 8.0 及更新版本中。
# isi config reboot
# isi config shutdown
# isi_save_journal
# isi_kill_busy && umount /ifs
# isi_checkjournal
如有需要,請聯絡 Dell 技術支援 。
isi status -q
命令,以檢閱叢集的健全狀況。在繼續操作之前,請確認運行狀況 DASR 列中的所有節點都 正常 ,並且未處於唯讀 (R) 模式。對於運行狀況良好的群集,應顯示類似於以下內容的輸出:Cluster Name: mycluster Cluster Health: [ OK ] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-OK- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi services apache2 enable isi services isi_hdfs_d enable isi services isi_iscsi_d enable isi services ndmpd enable isi services nfs enable isi services smb enable isi services vsftpd enable
# isi_gather_info --esrs
執行狀況檢查的步驟。
這適用於所有擁有受支援代碼版本叢集有效維護協議的客戶。
如果您符合這些要求,請在 Dell 線上支援網站上開立服務要求 (SR),要求「Isilon 執行狀況檢查」。
*執行狀況檢查並非為了修正叢集問題,或評估叢集的組態、效能或工作流程。