# isi_gather_info
# isi_gather_info
*运行状况检查不用于修复群集问题或评估群集的配置、性能或工作流。
isi config shutdown <node_lnn>
isi status -q
命令,然后在输出的 Health DASR 列中查找 OK 。已选择问题的示例。节点 1 已成功重新加入群集,但 Health DASR列指示它需要注意。
mycluster-1# isi status -q Cluster Name: mycluster Cluster Health: [ ATTN] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-A-- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi status -q
isi config reboot <node_lnn>
但是, 戴尔强烈建议 使用冷重新启动方法更有效地识别潜在的硬件问题。
阶段 2:关闭群集中的每个节点。
这些步骤将在您关闭 Isilon 群集的当天执行。在群集范围关闭期间,某些因素可能会影响或延迟关闭过程。例如,对节点的未完成数据写入可能会影响关闭。步骤 1-2 的目的是确保所有客户端都与群集断开连接,并且在运行 shutdown 命令之前,数据已从节点日志正确保存到文件系统。如果您有 iSCSI 客户端,请确保在禁用 iSCSI 服务之前关闭客户端。
步骤 3 介绍了如何使用串行控制台按顺序关闭群集中的每个节点。建议使用此方法,因为它使您能够在继续下一个节点之前验证每个节点是否已正确关闭,并根据需要进行调整或修复问题以确保群集正确关闭。但是,此方法可能非常耗时,因为它需要将串行控制台连接到每个节点以运行 shutdown 命令。同时关闭群集中的所有节点部分介绍了如何使用 OneFS 命令行界面或 OneFS Web 管理界面关闭群集。此方法比步骤 3 耗时更少,但使得识别在关闭过程中遇到问题的节点更具挑战性。
isi services apache2 isi services isi_hdfs_d isi services isi_iscsi_d isi services ndmpd isi services nfs isi services smb isi services vsftpd
mycluster-4# isi services smb Service 'smb' is enabled. mycluster-4# isi services nfs Service 'nfs' is disabled. mycluster-4#
isi services apache2 disable isi services isi_hdfs_d disable isi services isi_iscsi_d disable isi services ndmpd disable isi services nfs disable isi services smb disable isi services vsftpd disable
如果您有 iSCSI 客户端,请确保 iSCSI 客户端在执行步骤 2 之前已卸载其 LUN。运行 isi iscsi list
命令确认所有 iSCSI 客户端都已与群集断开连接。
isi_iscsi_d disable
命令启用和配置 SRS。对已装载的 iSCSI LUN 的中断可能会对客户端造成损坏,这通常需要从备份中恢复。
isi_for_array isi_flush
命令启用和配置 SRS。每个节点上将显示如下输出:mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... mycluster-1: Cache flushing complete.
mycluster-4# isi_for_array isi_flush mycluster-1: Flushing cache... vinvalbuf: flush failed, 1 clean and 0 dirty bufs remaining mycluster-2: Flushing cache... fsync: giving up on dirty
运行 isi_for_array isi_flush
命令。如果任何节点刷新失败,请联系戴尔 Isilon 技术支持。在继续执行下一步之前,所有节点都必须成功刷新。
isi_for_array shutdown -p
用于关闭群集的命令。
isi config shutdown
Powering the system off using ACPI
2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Attempting to save journal to default location 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: Saving journal to /var/journal/journal.gz 2014-03-22T00:35:19Z <1.5> mycluster-3(id11) isi_save_journal[44868]: All data saved successfully 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: Attempting to save journal to default location 2014-03-22T00:37:29Z <1.5> mycluster-3(id11) isi_save_journal[45074]: A valid backup journal already exists. Not saving. An example of a node journal save failure is highlighted in the output below: 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: ERROR: Validation failed for backup journal. Shutdown aborted 2014-03-21T23:39:09Z <1.4> mycluster-3(id11) /sbin/shutdown: Failed command output:
如果您收到节点日志未保存的错误,您可以通过执行 阶段 3 中的步骤手动保存日志。
如果发生紧急情况,您可以同时关闭群集中的所有节点。但是,不建议使用此方法,因为它无法在出现问题时监视每个节点的状态和输出。如果您选择执行这些步骤,戴尔强烈建议执行 第 3 阶段 中的所有步骤,以验证在执行以下步骤后所有节点均已正确关闭。
# isi config shutdown all
isi_for_array shutdown -p
命令从 OneFS Web 管理界面(在 OneFS 8.0 及更高版本中)关闭群集。
# isi config reboot
# isi config shutdown
# isi_save_journal
# isi_kill_busy && umount /ifs
# isi_checkjournal
如果需要,请联系 戴尔技术支持 。
isi status -q
命令来检查群集的运行状况。在继续操作之前,请验证“运行状况”DASR列中的所有节点是否 正常 ,并且未处于只读 (R) 模式。对于运行状况良好的群集,应显示类似于以下内容的输出:Cluster Name: mycluster Cluster Health: [ OK ] Cluster Storage: HDD SSD Size: 11G (23G Raw) 0 (0 Raw) VHS Size: 11G Used: 7.9G (69%) 0 (n/a) Avail: 3.5G (31%) 0 (n/a) Health Throughput (bps) HDD Storage SSD Storage ID |IP Address |DASR | In Out Total| Used / Size |Used / Size -------------------+-----+-----+-----+-----+-----------------+----------------- 1|10.1.16.141 |-OK- | 0| 150K| 150K| 2.0G/ 2.8G( 69%)| (No SSDs) 2|10.1.16.142 |-OK- | 98K| 13K| 112K| 2.0G/ 2.8G( 69%)| (No SSDs) 3|10.1.16.143 |-OK- | 0| 44K| 44K| 2.0G/ 2.8G( 69%)| (No SSDs) 4|10.1.16.144 |-OK- | 0| 512| 512| 2.0G/ 2.8G( 69%)| (No SSDs) -------------------+-----+-----+-----+-----+-----------------+----------------- Cluster Totals: | 98K| 208K| 306K| 7.9G/ 11G( 69%)| (No SSDs) Health Fields: D = Down, A = Attention, S = Smartfailed, R = Read-Only
isi services apache2 enable isi services isi_hdfs_d enable isi services isi_iscsi_d enable isi services ndmpd enable isi services nfs enable isi services smb enable isi services vsftpd enable
# isi_gather_info --esrs
运行运行状况检查的步骤。
这适用于针对受支持代码版本的群集签订有效维护协议的所有客户。
如果您满足这些要求,请在戴尔在线支持网站上打开服务请求 (SR),请求“Isilon 运行状况检查”。
*运行状况检查不用于修复群集问题或评估群集的配置、性能或工作流。