# isi_gather_info
# isi_gather_info
*健全狀況檢查並非為了修正叢集問題,或評估叢集的組態、效能或工作流程。
isi config shutdown <node_lnn>
isi status -q
命令,確認節點是否已重新加入叢集且狀況良好,然後在輸出的「健全狀況 DASR」欄中尋找確定。已選取問題的範例。節點 1 已成功重新加入叢集,但「健全狀況 DASR」欄指示它需要注意。
mycluster-1# isi status -q Cluster Name: mycluster Cluster Health: [ ATTN] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-A-- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi status -q
isi config reboot <node_lnn>
但是,Dell 強烈建議使用冷重新開機方法,以更有效地識別潛在的硬體問題。
第 2 階段:關閉叢集中的每個節點。
這些步驟會在您關閉 Isilon Cluster 的當天執行。在全叢集關機期間,一些因素可能會影響或延遲關機程序。例如,對節點未完成的資料寫入可能會影響關機。步驟 1-2 的目的是確保在執行關機命令之前,所有用戶端都已從叢集中斷連線,且節點日誌中的資料已正確儲存至檔案系統。如果您有 iSCSI 用戶端,請務必在停用 iSCSI 服務前關閉用戶端。
步驟 3 介紹如何使用序列主控台循序關閉叢集中的每個節點。建議使用此方法,因為它使您能夠在繼續下一個節點之前確認每個節點是否正確關閉,並根據需要進行調整或修正問題,以確保叢集正確關閉。但是,此方法可能很耗時,因為它需要將序列主控台連接到每個節點以執行關機命令。同時關閉叢集中的所有節點一節說明如何使用 OneFS 命令列介面或 OneFS Web 管理介面來關閉叢集。此方法比步驟 3 較不耗時,但會讓識別關機過程中發生問題的節點更加困難。
isi services apache2 isi services isi_hdfs_d isi services isi_iscsi_d isi services ndmpd isi services nfs isi services smb isi services vsftpd
mycluster-4# isi services smb Service 'smb' is enabled. mycluster-4# isi services nfs Service 'nfs' is disabled. mycluster-4#
isi services apache2 disable isi services isi_hdfs_d disable isi services isi_iscsi_d disable isi services ndmpd disable isi services nfs disable isi services smb disable isi services vsftpd disable
如果您有 iSCSI 用戶端,請確保 iSCSI 用戶端已在執行步驟 2 前取消掛接其 LUN。執行 isi iscsi list
命令,確認所有 iSCSI 用戶端都已從叢集中斷連線。
isi_iscsi_d disable
命令。中斷已掛接的 iSCSI LUN 可能會導致用戶端受損,這通常需要從備份復原。
isi_for_array isi_flush
命令。每個節點上都會顯示類似以下內容的輸出:mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... mycluster-1: Cache flushing complete.
mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... vinvalbuf: flush failed, 1 clean and 0 dirty bufs remaining mycluster-2: Flushing cache... fsync: giving up on dirty
再次執行 isi_for_array isi_flush
命令。若有任何節點無法排清,請聯絡 Dell Isilon 技術支援。所有節點都必須成功排清,才能繼續下一個步驟。
isi_for_array shutdown -p
命令來關閉叢集。
isi config shutdown
Powering the system off using ACPI
2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Attempting to save journal to default location 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Saving journal to /var/journal/journal.gz 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: All data saved successfully 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: Attempting to save journal to default location 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: A valid backup journal already exists. Not saving. An example of a node journal save failure is highlighted in the output below: 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: ERROR: Validation failed for backup journal. Shutdown aborted 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: Failed command output:
如果收到節點日誌未儲存的錯誤,可以透過執行第 3 階段中的步驟手動儲存日誌。
如果發生緊急情況,您可以同時關閉叢集中的所有節點。但是,不建議使用此方法,因為它無法讓您在發生問題時監控每個節點的狀態和輸出。如果您選擇執行這些步驟,Dell 強烈建議您遵循第 3 階段的所有步驟,以確認在執行下列程序後,是否已正確關閉所有節點。
# isi config shutdown all
isi_for_array shutdown -p
命令,以在 OneFS 8.0 及更新版本中從 OneFS Web 管理介面關閉您的叢集。
# isi config reboot
# isi config shutdown
# isi_save_journal
# isi_kill_busy && umount /ifs
# isi_checkjournal
如有需要,請聯絡 Dell 技術支援。
isi status -q
命令,以檢閱叢集的健全狀況。在繼續操作之前,請確認健全狀況 DASR 欄中的所有節點都正常,且未處於唯讀 (R) 模式。對於健全狀況良好的叢集,應顯示類似於以下內容的輸出:Cluster Name: mycluster Cluster Health: [ OK ] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-OK- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi services apache2 enable isi services isi_hdfs_d enable isi services isi_iscsi_d enable isi services ndmpd enable isi services nfs enable isi services smb enable isi services vsftpd enable
# isi_gather_info --esrs
執行健全狀況檢查的步驟。
這適用於所有擁有受支援代碼版本叢集有效維護合約的客戶。
如果您符合這些要求,請在 Dell 線上支援網站上開立服務要求 (SR),要求「Isilon 健全狀況檢查」。
*健全狀況檢查並非為了修正叢集問題,或評估叢集的組態、效能或工作流程。