主機上的其中一個管理服務可能發生故障或進入「無回應」狀態。
這需要針對管理服務失敗或停止回應的原因進行根本原因分析。在使叢集/ESXi 進入穩定狀態之前,參閱收集 VMware ESXi 的診斷資訊,以收集 vCenter Server 和 ESXi 主機記錄。有時這無法完成,因為節點並未回應收集記錄的命令。請檢閱本文「解決方案」一節中的資訊。如有必要,可透過 Dell 支援分析記錄以瞭解根本原因,以檢查問題是否與以下已知問題相關。
重新開機主機上的 hostd 或 vpxa,可協助恢復 vSphere 用戶端上的主機管理功能。這可以使用 SSH 工作階段至 ESXi 主機來完成。
對「無回應」ESXi 主機的另一個回應是重新啟動 ESXi 主機上的管理代理程式。
您可以直接使用 CLI/SSH 工作階段至 ESXi 的方式重新啟動 ESXi 主機的管理代理程式 (如果在發生問題之前已啟用 SSH)。
但是,如果未啟用 SSH,則存取 BMC/iDRAC 連接埠可讓您存取 ESXi DCUI 畫面,在該畫面中可以重新啟動管理服務。
請參閱 VMware KB - 1003490,以在 ESXi 中重新啟動管理代理程式。
DCUI 可能會沒有回應。使用 SSH 或 RDP 手動關閉虛擬機器 (VM) 是將環境恢復到穩定狀態的唯一其他選項。完成後,請使用 BMC/iDRAC 電源控制,重新啟動 ESXi 主機電源,讓 ESXi 主機回到穩定狀態。
若要減少將「無回應」ESXi 主機重新開機前的虛擬機器停機時間。關閉虛擬機器後,請立即將虛擬機器註冊至其他穩定主機。(之後問題 ESXi 主機可以重新開機)
以下是如何在 vCenter Server
中將虛擬機器 (VM) 註冊或新增至 vSphere 清查的步驟: 如果無法使用 SSH/RDP 關閉虛擬機器電源,請透過 ESXi 主機 SSH 工作階段終止虛擬機器,請參閱無法關閉 ESXi 主機中的虛擬機器電源
無法關閉 ESXi 主機中的虛擬機器電源 - 1014165
關閉 ESXi 主機上無回應的虛擬機器電源 - 1004340
虛擬機器在 vCenter Server 中顯示為無效或孤立 - 1003742
虛擬機器似乎正在多個 ESX/ESXi 伺服器上執行或註冊 - 1005051
當無法使用 vSphere Client 管理主機時,從命令列開啟虛擬機器電源 - 1038043
故障診斷已停止回應的虛擬機器 - 1007819
從 vmware.log 重新建置虛擬機器的 .vmx 檔案 - 1023880
調查 ESXi 上的虛擬機器檔案鎖定 - 10051
驗證 ESX/ESXi 虛擬機器檔案完整性 - 1003743