主机上的其中一个管理服务可能出现故障或进入“无响应”状态。
这需要对管理服务失败或停止响应的原因进行根本原因分析。在将群集/ESXi 恢复到稳定状态之前,请参阅 收集 VMware ESXi 的诊断信息 ,收集 vCenter Server 和 ESXi 主机日志。有时可能无法完成此任务,因为节点不响应收集日志的命令。请查看本文“解决方案”部分中的信息。如有必要,DELL EMC 支持人员可以分析日志以了解根本原因,以检查以下已知问题是否与此问题相关。
重新启动主机上的 hostd 或 vpxa 可帮助恢复 vSphere Client 上的主机可管理性。可以使用与 ESXi 主机的 SSH 会话来完成此操作。
对“无响应”ESXi 主机的另一个响应是重新启动 ESXi 主机上的管理代理。(请参阅 VMware 知识库文章 - 1003490)
可以使用与 ESXi 的 CLI/SSH 会话直接重新启动 ESXi 主机的管理代理(如果在问题发生之前启用了 SSH)。
但是,如果未启用 SSH,则访问 BMC/iDRAC 端口将允许访问可在其中重新启动管理服务的 ESXi DCUI 屏幕。
请参阅 VMware 知识库文章 - 1003490,了解如何在 ESXi 中重新启动管理代理。
如果 DCUI 控制台接口停止响应,并且您无法重新启动管理代理或服务,则使用 SSH 或 RDP 手动关闭虚拟机(已在该节点上注册,但在 vCenter 上显示已断开连接)是唯一可以使虚拟机和 ESXi 主机恢复到稳定状态的唯一方法。完成后,使用 BMC/iDRAC 电源控制、关闭后重启(重新启动)ESXi 主机,使 ESXi 主机处于稳定状态。
在重新启动“无响应”ESXi 主机之前,您可以减少虚拟机的停机时间。关闭虚拟机后,立即将虚拟机注册到其他稳定的主机。(之后可以重新启动问题 ESXi 主机)。
以下是有关如何在
vCenter Server 中注册或将虚拟机 (VM) 添加到 vSphere 资源清册的步骤。
如果无法使用 SSH/RDP 关闭虚拟机,则通过 ESXi 主机 SSH 会话终止虚拟机,请参阅
无法关闭 ESXi 主机中的虚拟机。
虚拟机问题:
无法关闭 ESXi 主机中的虚拟机 -
1014165
关闭 ESXi 主机上无响应的虚拟机 -
1004340
虚拟机在 vCenter Server 中显示为无效或孤立 -
1003742
虚拟机似乎正在多个 ESX/ESXi 服务器上运行或注册 -
1005051
运行虚拟机不可访问并且缺少配置文件 -
2006648
当无法使用 vSphere Client 管理主机时,虚拟机在重新启动其所在的 ESXi 主机后会孤立 —
2013301
从命令行打开虚拟机电源 -
1038043
无法打开以前运行的 ESX/ESXi 虚拟机 -
1003648
对已停止响应的虚拟机进行故障排除 -
1007819
无法打开托管虚拟机的电源 -
1003671
虚拟机文件相关问题:
从 vmware.log 重建虚拟机的 .vmx 文件 -
1023880
调查 ESXi 上的虚拟机文件锁定 -
10051
验证 ESX/ESXi 虚拟机文件完整性 -
1003743