浏览
帮助
登录
此帖子已超过 5 年
Solved!
yansheng
2 Intern
•
235 消息
0
6193
2015年7月29日 05:00
cx4 0-0-4 槽位的盘坏了,更换一个新的为啥没办法识别 到。
盘是好的
更换了多个盘,这个位置是不是被锁住了,怎么解锁
回复(16)
Roger_Wu
4K 消息
2015年7月31日 06:00
SPB上Disk 0.0.4的状态和SPA一样都是Missing,详细看了下日志发现这块盘触发了很多CFD (Critical Foreign & Missing Drive,它的功能是保证硬盘插入正确的槽位,具体参考KB emc233207,仅EMC员工和经销商可见),
如果原来那个坏的盘还在,那可以尝试reseat一下看看是否能从Missing状态变为Faulted。否则确实可能是楼上说盘柜问题(LCC),对应KB参考emc310527,也是仅EMC员工和经销商可见。
2015年7月29日 19:00
盘的来源是?P/N都对的起来吗?
SP logs或SPCollects日志有查看过报什么错不?CX4没有什么被锁一说,或者你看看热备盘有没有顶上。
这个最好还是收集SPcollects日志分析一下。
2015年7月30日 05:00
0-0-4 这个盘黄灯和绿灯常亮,我已经更换很多这样的盘,包括我把存储上正常的0-0-14的热备盘换过来一样的故障,
系统界面显示是faulted状态。日志
Yanhong1
1.6K 消息
2015年7月30日 06:00
Jacks,日志有收集吗?看你上个回复好像没打全
2015年7月30日 07:00
splog 帮看下
1个附件
FCNCP101700036_SPA_2015-07-30_08-30-50_28b006_data.zip
回复的时候,右上角的链接可以切换到高级编辑器,里面可以加附件。不过不清楚日志会不会太大
怎么上传日志??
2015年7月30日 20:00
这台设备问题一大堆啊:
(904/988/88d) Enc Over temperature : 3,参考KB emc160824
(a4b) Coherency Error : 45,参考KB emc160329
另外还有reboot from bugcheck,参考KB emc263133
A 07/30/15 04:39:50 Save Dump 2183 Reboot from bugcheck: 0xe111805f (0xfffffadfc2535c80, 0x0000000000000001, 0x0000000000000000, 0x000000000000029b). A dump was saved in: C:\dumps\crash.dmp. [DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ] [ BugcheckCode: e111805f Definition: DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ]
这台设备还有好几次意外掉电:
Reboot Time SP Cause Event Time FE Up Downtime Boottime Bugcheck Code
----------------- --- ----------------- ------------------ ----- -------- -------- -------------------
07/01/15 02:32:50 SPA Powerfail 07/01/15 02:28:41 YES 00:14:07 00:09:58
07/23/15 03:02:46 SPA Powerfail 07/23/15 02:59:07 YES 00:37:35 00:33:56
07/30/15 03:52:32 SPA Powerfail 07/30/15 03:45:58 NO
07/30/15 04:39:05 SPA Bugcheck 07/30/15 04:04:11* NO E111805F DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED
07/30/15 05:02:08 SPA Unexplained 07/30/15 04:49:49* NO
07/30/15 05:06:54 SPA Powerfail 07/30/15 05:03:33* NO
07/30/15 06:04:44 SPA Unexplained 07/30/15 05:17:25* NO
07/30/15 06:17:10 SPA Powerfail 07/30/15 06:09:31* YES 00:14:40 00:07:01
07/30/15 07:09:29 SPA Powerfail 07/30/15 07:01:32 YES 00:11:28 00:03:31
07/30/15 07:36:32 SPA Powerfail 07/30/15 07:20:51 YES 00:51:10 00:35:29
其中一个System LUN目前是Break (BRK)状态,就是Disk 0.0.4拔出引起:
- - - 8196 961 ST4 RAID-3 - - 17.7 GB --- SP-A BRK* 0.0.0 0.0.1 0.0.2 0.0.3 0.0.4 (MIS)
由于SP意外掉电过,两边SP的状态可能不一致,需要收集两边SP的SPcollects日志一起分析。后续的处理一般也需要Level 2或者Engineering Team的介入。你是经销商还是最终用户?这台设备还有保不?如果是生产环境建议尽快联系EMC售后。
2015年7月31日 02:00
spb log
掉电是自己关掉sps电池的原因
现在就是004 这个盘换了很多个就是不识别
FCNCP101700036_SPB_2015-07-30_08-31-15_290044_data.zip
2015年7月31日 03:00
与柜子没关系
eric_wang2
28 消息
换DAE的柜子吧.
遇到过这种情况.
怎么判断与DAE没有关系的?
后端接口板积碳比较多后,就会造成接触不良...
2015年7月31日 20:00
楼上是汽车爱好者吧,积碳一词很穿越啊......
liulei_it
3.2K 消息
2015年8月1日 16:00
那应该是氧化吧
67557775
3 消息
2015年8月2日 18:00
LUN 8196已经坏了,是否可以通过FCLI把他删掉,在重新bind。不过没试过。
这个0-0-4这个盘 在日志里应该有以前那个盘的SN,找到那个快盘插回去,看能不能好。其他盘都会踢出来,如果SN不对。
戴尔支持资源
查看更多
查看全部
Top
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2015年7月31日 06:00
SPB上Disk 0.0.4的状态和SPA一样都是Missing,详细看了下日志发现这块盘触发了很多CFD (Critical Foreign & Missing Drive,它的功能是保证硬盘插入正确的槽位,具体参考KB emc233207,仅EMC员工和经销商可见),
如果原来那个坏的盘还在,那可以尝试reseat一下看看是否能从Missing状态变为Faulted。否则确实可能是楼上说盘柜问题(LCC),对应KB参考emc310527,也是仅EMC员工和经销商可见。
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2015年7月29日 19:00
盘的来源是?P/N都对的起来吗?
SP logs或SPCollects日志有查看过报什么错不?CX4没有什么被锁一说,或者你看看热备盘有没有顶上。
这个最好还是收集SPcollects日志分析一下。
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年7月30日 05:00
0-0-4 这个盘黄灯和绿灯常亮,我已经更换很多这样的盘,包括我把存储上正常的0-0-14的热备盘换过来一样的故障,
系统界面显示是faulted状态。日志
Yanhong1
1.6K 消息
0
2015年7月30日 06:00
Jacks,日志有收集吗?看你上个回复好像没打全
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年7月30日 07:00
splog 帮看下
1个附件
FCNCP101700036_SPA_2015-07-30_08-30-50_28b006_data.zip
Yanhong1
1.6K 消息
0
2015年7月30日 07:00
回复的时候,右上角的链接可以切换到高级编辑器,里面可以加附件。不过不清楚日志会不会太大
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年7月30日 07:00
怎么上传日志??
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2015年7月30日 20:00
这台设备问题一大堆啊:
(904/988/88d) Enc Over temperature : 3,参考KB emc160824
(a4b) Coherency Error : 45,参考KB emc160329
另外还有reboot from bugcheck,参考KB emc263133
A 07/30/15 04:39:50 Save Dump 2183 Reboot from bugcheck: 0xe111805f (0xfffffadfc2535c80, 0x0000000000000001, 0x0000000000000000, 0x000000000000029b). A dump was saved in: C:\dumps\crash.dmp. [DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ]
[ BugcheckCode: e111805f Definition: DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED ]
这台设备还有好几次意外掉电:
Reboot Time SP Cause Event Time FE Up Downtime Boottime Bugcheck Code
----------------- --- ----------------- ------------------ ----- -------- -------- -------------------
07/01/15 02:32:50 SPA Powerfail 07/01/15 02:28:41 YES 00:14:07 00:09:58
07/23/15 03:02:46 SPA Powerfail 07/23/15 02:59:07 YES 00:37:35 00:33:56
07/30/15 03:52:32 SPA Powerfail 07/30/15 03:45:58 NO
07/30/15 04:39:05 SPA Bugcheck 07/30/15 04:04:11* NO E111805F DLS_BUGCHECK_EXECUTIONER_LOCK_REQUEST_BY_CABALID_EXPIRED
07/30/15 05:02:08 SPA Unexplained 07/30/15 04:49:49* NO
07/30/15 05:06:54 SPA Powerfail 07/30/15 05:03:33* NO
07/30/15 06:04:44 SPA Unexplained 07/30/15 05:17:25* NO
07/30/15 06:17:10 SPA Powerfail 07/30/15 06:09:31* YES 00:14:40 00:07:01
07/30/15 07:09:29 SPA Powerfail 07/30/15 07:01:32 YES 00:11:28 00:03:31
07/30/15 07:36:32 SPA Powerfail 07/30/15 07:20:51 YES 00:51:10 00:35:29
其中一个System LUN目前是Break (BRK)状态,就是Disk 0.0.4拔出引起:
- - - 8196 961 ST4 RAID-3 - - 17.7 GB --- SP-A BRK* 0.0.0 0.0.1 0.0.2 0.0.3 0.0.4 (MIS)
由于SP意外掉电过,两边SP的状态可能不一致,需要收集两边SP的SPcollects日志一起分析。后续的处理一般也需要Level 2或者Engineering Team的介入。你是经销商还是最终用户?这台设备还有保不?如果是生产环境建议尽快联系EMC售后。
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年7月31日 02:00
spb log
掉电是自己关掉sps电池的原因
现在就是004 这个盘换了很多个就是不识别
1个附件
FCNCP101700036_SPB_2015-07-30_08-31-15_290044_data.zip
yansheng
2 Intern
2 Intern
•
235 消息
0
2015年7月31日 03:00
与柜子没关系
eric_wang2
28 消息
0
2015年7月31日 03:00
换DAE的柜子吧.
遇到过这种情况.
eric_wang2
28 消息
0
2015年7月31日 06:00
怎么判断与DAE没有关系的?
后端接口板积碳比较多后,就会造成接触不良...
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2015年7月31日 20:00
楼上是汽车爱好者吧,积碳一词很穿越啊......
liulei_it
2 Intern
2 Intern
•
3.2K 消息
0
2015年8月1日 16:00
那应该是氧化吧
67557775
3 消息
0
2015年8月2日 18:00
LUN 8196已经坏了,是否可以通过FCLI把他删掉,在重新bind。不过没试过。
这个0-0-4这个盘 在日志里应该有以前那个盘的SN,找到那个快盘插回去,看能不能好。其他盘都会踢出来,如果SN不对。