管理控制器 (MC) 和儲存控制器 (SC) 是 ME 系列陣列上的不同子系統。陣列會繼續供應 I/O,但是所有管理介面 (UI、SSH、序列、SNMP 或 REST API) 都沒有回應。
典型癥狀:
事後檢閱事件記錄時,請參閱以下解決方案步驟。即使沒有進行韌體升級,系統管理員仍可能在事件歷程記錄中看到下列項目。
... B849 2023-08-08 01:08:16 152 WARNING The Storage Controller is not receiving data from the Management Controller. (This is normal during firmware update.) ...
記憶體不足的情況會導致管理應用程式進程終止。在外部管理應用程式使用 SNMP 或 REST API 輪詢管理介面的環境中,可能會更頻繁發生。
ME5 版本資訊:
FMW-65056 解決可能導致 CLI 和使用者介面無回應的情況。
哪些系統可能會受到影響?
產品 (與版本) | 下列 Dell PowerVault ME5 系列儲存系統
|
執行此核心軟體 (作業系統或作業環境) |
PowerVault ME5 控制器韌體低於 ME5.1.2.0.1 版本 |
開啟 SSH 工作階段至每個控制器的管理介面,並以管理或系統管理員層級使用者身分登入。或者,系統管理員可嘗試使用每個控制器的 USB 序列連接。如果無法使用 SSH 或序列連線登入,請前往 步驟 2:實際重新拔插一個控制器模組或關閉陣列電源。
如果登入成功,請使用下列命令在每一個上重新開機管理控制器:
restart mc full # restart mc full During the restart process you will briefly lose communication with the specified Management Controller(s). Do you want to continue? (y/n) y Info: Restarting the local MC (A)... Success: Command completed successfully. (2023-08-24 05:34:01) # Killed
案例 1:具有冗餘路徑主機配置
的雙控制器無需維護時段即可實施這些步驟。
必須滿足以下條件:
如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的「模組卸除與更換>客戶可更換單元」一節。
實體將控制器模組 B 在插槽中向前拉約 5 公分或 2 吋,然後在 30 秒後重新安裝控制器模組。
控制器 B 大約需要兩到三分鐘的時間才能完成開機和韌體載入。
開啟連接至控制器 B 管理 IP 位址的 SSH 工作階段,並以管理或系統管理員層級的使用者身分登入。
重新啟動對等儲存控制器 A。輸入命令:
restart sc a # restart sc a While a Storage Controller is restarting, communication will temporarily be lost with the corresponding Management Controller, and also may cause a temporary loss of data availability. Do you want to continue? (y/n) y Success: Command completed successfully. - The command to restart SC A completed successfully. The controller will restart in approximately 30 seconds. (2023-08-24 07:08:39)
當同儕控制器上線時,請登入 PowerVault Manager,然後前往 步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
案例 2:單控制器模組或非冗餘主機路徑配置
維護時段為必填。意外移除單一資料路徑代表主機失去資料存取權並停止回應!
如需相關指南,請參閱 Dell PowerVault ME5 系列儲存系統擁有者手冊中的「模組卸除與更換>客戶可更換單元」一節。
通知使用者服務中斷,並依照主機作業系統使用者指南,讓連線的主機進入維護模式或關閉主機。
在陣列背面,將兩個電源供應器關閉約 60 秒,然後再重新開啟。
控制器完成開機並載入韌體需要大約三分鐘的時間。
登入 PowerVault Manager,然後前往 步驟 3:將控制器模組韌體升級至 ME5.1.2.1.0 或更新版本。
請參閱 Dell PowerVault ME5 系列系統管理員指南的更新系統韌體一節。
使用 ME5 控制器韌體版本 ME5.1.2.0.1 或更新版本時,系統管理員可能偶爾會收到下列資訊警示。
圖 1:資訊警示
The Management Controller entered a memory exhaustion state and will reboot to recover. Data access will not be interrupted.
管理控制器 (MC) 提供管理 UI 和 CLI 介面,以監控和設定系統。重新啟動管理服務不會重新開機控制器或中斷 I/O。重新開機的效果是兩分鐘內無法存取管理介面。如果您經常收到此資訊警報,則可能需要進一步調查以確定原因。