警报 ID | XMS_NODE_FRU_STATE_FAILED |
警报文本 | 节点出现故障 |
说明 | 本文介绍基本存储模块中存储控制器节点的警报。它仅涵盖故障状态 — 有关其他节点状态警报,请参阅SLN317238 。本文还介绍在设置初始配置向导硬件检查报告的新系统时可能出现的节点错误情况。 有关 ICW 硬件检查的详细信息,请参阅SLN317258。 |
错误代码 | (0x00304403) |
解析 | 原因 如果系统固件在接通电源和每次重新启动时运行的自检过程中检测到问题,则会出现节点故障状态警报。 该平台软件监视固件是否存在这些错误,并通过发出警报以及将 FRU 运行状况设置为“故障”状态来报告这些错误。 处于故障状态的节点将无法正常运行,因此解决错误情况以保持设备的 HA 冗余非常重要。 对于尚未配置的系统,初始配置向导将执行运行状况检查 (ICW HW),以检查固件是否存在错误,如果存在错误,则会报告设备处于“未配置的故障”状态。 您无法配置处于故障状态的设备,必须先解决错误情况,然后才能完成配置过程。 有关如何对 ICW 硬件问题进行分类的信息,请参阅 SLN317258。 ICW 硬件可能报告的与节点相关的问题是故障状态寄存器检查:“Fault Status Register FLT | Node”(故障状态寄存器 FLT | 节点)或本地或对等节点的 FRU 状态寄存器中存在意外值:“FRU status: Unknown | Local Node | 0x****”(FRU 状态:未知 | 本地节点 | 0x****)和“FRU status: Unknown | Peer Node | 0x****”(FRU 状态:未知 | 对等节点 | 0x****) 对于某些类型的错误,固件可能会指示多个 FRU,因为无法准确地确定是哪个 FRU 导致了错误。 例如,如果固件检测到 I/O 模块的次优 PCI 设置,则无法确定该问题的原因是出在 I/O 模块还是出在节点。 解决方案 解决这些错误可能需要更换节点;或者,如果出现多个 FRU 警报,则可能需要更换其中一个关联的 FRU。此外,还有一些已知的错误情况,您可以在不需要更换任何硬件的情况下,将这类错误情况清除。 请联系技术支持 以便他们可以检查错误的根本原因,从而确定最佳行动方案。 |