管理控制器 (MC) 和存储控制器 (SC) 是 ME 系列阵列上的独立子系统。阵列继续处理 I/O,但所有管理接口(UI、SSH、串行、SNMP 或 REST API)均无响应。
典型症状:
之后查看事件日志时,请参阅下面的解决步骤。即使没有正在进行的固件升级,管理员也可能在事件历史记录日志中看到以下条目。
... B849 2023-08-08 01:08:16 152 WARNING The Storage Controller is not receiving data from the Management Controller. (This is normal during firmware update.) ...
内存不足的情况会导致管理应用程序进程终止。在外部管理应用程序使用 SNMP 或 REST API 轮询管理接口的环境中,发生率可能更高。
ME5 发行说明:
FMW-65056 解决了可能导致 CLI 和用户界面无响应的情况。
哪些系统可能会被影响?
产品(和版本) | 以下 Dell PowerVault ME5 系列存储系统
|
运行此核心软件 (操作系统或操作环境) |
低于版本 ME5.1.2.0.1 的 PowerVault ME5 控制器固件 |
打开到每个控制器管理接口的 SSH 会话,然后以管理或管理员级别用户身份登录。或者,管理员可以尝试使用 USB 串行连接到每个控制器。如果无法使用 SSH 或串行连接登录,请转至 步骤 2:以物理方式重新拔插一个控制器模块或关闭阵列电源。
如果登录成功,请使用以下命令重新启动每个控制器上的管理控制器:
restart mc full # restart mc full During the restart process you will briefly lose communication with the specified Management Controller(s). Do you want to continue? (y/n) y Info: Restarting the local MC (A)... Success: Command completed successfully. (2023-08-24 05:34:01) # Killed
情况 1:具有冗余路径的双控制器主机配置
无需维护窗口即可实施这些步骤。
必须满足以下条件:
有关指导,请参阅《Dell PowerVault ME5 SeriesStorage System Owner's Manual》(戴尔 PowerVault ME5 系列存储系统用户手册)中的模块拆卸和更换>客户可更换部件部分。
将控制器模块 B 物理地向前拉入插槽约 5 厘米或约 2 英寸,然后在 30 秒后重新拔插控制器模块。
等待控制器 B 大约两到三分钟以完成引导和固件加载。
打开与控制器 B 管理 IP 地址的 SSH 会话,并以管理或管理员级别用户身份登录。
重新启动对等存储控制器 A。 键入命令:
restart sc a # restart sc a While a Storage Controller is restarting, communication will temporarily be lost with the corresponding Management Controller, and also may cause a temporary loss of data availability. Do you want to continue? (y/n) y Success: Command completed successfully. - The command to restart SC A completed successfully. The controller will restart in approximately 30 seconds. (2023-08-24 07:08:39)
当对等控制器联机时,登录到 PowerVault Manager并转至 步骤 3:将控制器模块固件升级到 ME5.1.2.1.0 或更高版本。
情况 2:单控制器模块或非冗余主机路径配置
需要维护窗口。意外删除单个数据路径意味着主机失去对数据的访问并停止响应!
有关指导,请参阅《Dell PowerVault ME5 SeriesStorage System Owner's Manual》(戴尔 PowerVault ME5 系列存储系统用户手册)中的模块拆卸和更换>客户可更换部件部分。
通知用户中断,并按照主机操作系统用户指南将连接的主机置于维护模式或关闭主机。
在阵列背面,关闭两个电源约 60 秒,然后再将其打开。
等待大约三分钟,让控制器完成启动并加载固件。
登录到 PowerVault Manager,然后转至 步骤 3:将控制器模块固件升级到 ME5.1.2.1.0 或更高版本。
请参阅Dell PowerVault ME5 系列管理员指南中的更新系统固件部分。
对于 ME5 控制器固件版本 ME5.1.2.0.1 或更高版本,管理员可能偶尔会收到以下信息警报。
图 1:信息警报
The Management Controller entered a memory exhaustion state and will reboot to recover. Data access will not be interrupted.
管理控制器 (MC) 提供管理 UI 和 CLI 界面来监控和配置系统。重新启动管理服务不会重新启动控制器或中断 I/O。重新启动的效果是在两分钟内无法访问管理界面。如果您经常收到此信息警报,则可能需要进行更多调查以确定原因。