SPA__FCNPR053000799 这一台没接UPS cache是开不了得,这台的疑问是:在事件里看到:“A disk drive CRU signature error occurred. A server may have lost access to virtual disks on that disk drive. See the AX-series troubleshooting documentation to resolve the error”
既然你有渠道可以下到AX最新的固件,可以让他给你看一下知识库文档emc100840 "Enabling write cache on CLARiiON AX100-Series array with CRU signature or vault load errors"或emc60614 "Enabling write cache on CLARiiON array with CRU signature or vault load errors"中的方法。
alpha.cao
7 消息
0
2014年3月20日 23:00
谢谢!
alpha.cao
发件人: Fenglin Li
发送时间: 2014-03-21 14:04
收件人: alpha.cao
主题: Re: - 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
ECN
求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
reply from Fenglin Li in lei cao - View the full discussion
楼主,你好。我注意到,你的这个帖子被不小心创建在了你的个人的版面内了。建在个人版块里的帖子其他人基本没机会看到 。至于为什么会发生这样的情况以及如何避免,可参考我写的这个帖子 【帮助说明】如何避免帖子在不经意间被创建在了错误的版面里,导致收不到回复(因为别人看不到帖子)
你可以按照上面帖子里的步骤,将你的帖子移动到中文论坛的存储系统,这样更多的朋友能看见这个帖子来和你一起分享。谢谢。
Reply to this message by replying to this email, or go to the message on ECN
Start a new discussion in lei cao by email or at ECN
Following 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。 in these streams: Inbox
Fenglin1
2 Intern
2 Intern
•
2.1K 消息
0
2014年3月20日 23:00
楼主,你好。我注意到,你的这个帖子被不小心创建在了你的个人的版面内了。建在个人版块里的帖子其他人基本没机会看到 。至于为什么会发生这样的情况以及如何避免,可参考我写的这个帖子 【帮助说明】如何避免帖子在不经意间被创建在了错误的版面里,导致收不到回复(因为别人看不到帖子)
你可以按照上面帖子里的步骤,将你的帖子移动到中文论坛的存储系统,这样更多的朋友能看见这个帖子来和你一起分享。谢谢。
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2014年3月21日 02:00
如果是EMC经销商和合作伙伴的话,可以在EMC Service Partner Web上(先登录Powerlink再从导航列表进入)下载到AX4最新的固件和所需的Navisphere工具。
如果没有权限的话,可以联系一下你的客户经理让他帮忙看看。
alpha.cao
7 消息
0
2014年3月24日 09:00
Roger W:
谢谢,已经找EMC经销商要到了,但是碰到奇怪的问题:各部件的状态看起来都正常,但是cache还是关闭的。很是郁闷。
alpha.cao
发件人: Roger W.
发送时间: 2014-03-21 17:21
收件人: alpha.cao
主题: Re: - 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
ECN
求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
reply from Roger W. in 存储系统 - View the full discussion
如果是EMC经销商和合作伙伴的话,可以在EMC Service Partner Web上(先登录Powerlink再从导航列表进入)下载到AX4最新的固件和所需的Navisphere工具。
如果没有权限的话,可以联系一下你的客户经理让他帮忙看看。
Reply to this message by replying to this email, or go to the message on ECN
Start a new discussion in 存储系统 by email or at ECN
Following 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。 in these streams: Inbox
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2014年3月24日 18:00
收一下日志看看:
如何通过Navisphere Express收集CLARiiON AX系列的SP日志
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2014年3月25日 19:00
不知道是设备太老还是文件拿错(正常一般是xxxxxx_data.zip,你界面上只有xxxxxx_old_data.zip?),所以解开来后日志不是很全。从现有的日志来看,怀疑CPU module可能有问题
ktcons spstat
--------------------------------------------------------------------------------
About to start transfering FLARE globals
SP A
Statistics Logging: DISABLED PEER SP: PRESENT
WRITE CACHE: DISABLED READ CACHE: ENABLED
A: DP 00% TOTAL 4255 DIRTY 0000
B: TOTAL 4256
U: DP 00% TOTAL 0000
Requests Complete: 70549
SPS A: --
SPS B: --
slot : 0 1 2 3 4 5 6 7 8 9 10 11 | PSA PSB FAN0 FAN1 FAN2 FAN3 CPU
PIRAN-state: ENA ENA ENA UNB REM REM REM REM REM REM REM REM | OK OK OK OK OK OK FLT
建议再确认下两个SP的LED灯状态,以及设备之前的连线。如果都没有问题,那就确认日志是否收集正确。下次收集日志的时候,只要SPA、SPB都正常,那两边SP的SPCollects都需要收集。
alpha.cao
7 消息
0
2014年3月25日 19:00
收集了SPA的,不知道如何看!
SPA__FCNPR053000799 这一台没接UPS cache是开不了得,这台的疑问是:在事件里看到:“A disk drive CRU signature error occurred. A server may have lost access to virtual disks on that disk drive. See the AX-series troubleshooting documentation to resolve the error”
不确定是那块盘报错的。根据论坛的办法通过SMTP获取详细事件信息,因SMTP服务器不会配,没获取到详细事件信息。
------------------------------------------------------------
谢谢Roger W 的热心帮忙~~
alpha.cao
发件人: Roger W.
发送时间: 2014-03-25 09:47
收件人: alpha.cao
主题: Re: - 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
ECN
求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。
reply from Roger W. in 存储系统 - View the full discussion
收一下日志看看:
如何通过Navisphere Express收集CLARiiON AX系列的SP日志
Reply to this message by replying to this email, or go to the message on ECN
Start a new discussion in 存储系统 by email or at ECN
Following 求AX100_Series-Bundle-02.19.100.5.048.zip。手上有一台AX-100(02.19.100.5.014),想升级到02.19.100.5.048。 in these streams: Inbox
1个附件
SPA__FCNPR053000799_129fcc_03-26-2014_10-20-43_old_data.zip
alpha.cao
7 消息
0
2014年3月25日 20:00
1)FCNPR053300138 :这台
在Components中看所有部件都是好的,就是CACHE无法开启。对比了其他有cache的AX-100,无cache状态下,写入速度无法忍受,2G的写入要11分钟。
2)上封邮件提到的那台,SPA SPB的状态灯都对,而且都能登陆navispher,我一会连2个控制器再收集一次信息。
3)请问:收集的信息该如何看?谢谢
2个附件
FCNPR053300138_SPB_2014-03-26_11-09-07_116309b_data.zip
FCNPR053300138_SPA_2014-03-26_11-09-07_16309b_data.zip
alpha.cao
7 消息
0
2014年3月25日 21:00
FCNPR053000799 时间中有:“A disk drive CRU signature error occurred. A server may
have lost access to virtual disks on that disk drive. See the AX-series
troubleshooting documentation to resolve the error.”想知道是那块盘?
信息不是手工收集的,重启了阵列我在Diagnostic Files中下了2个最新的。
2个附件
SPB__FCNPR053000799_1129fcc_03-26-2014_11-25-44_data.zip
SPA__FCNPR053000799_129fcc_03-26-2014_11-26-31_data.zip
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2014年3月25日 21:00
工程师用的是TRiiAGE工具,在EMC Service Partner Web有下载。
这份日志全了,解开日志可以看到Write Cache无法Enable的原因:
B 03/26/14 10:18:30 SP B 66a Soft Vault Load Failure 0 ffffffff 1
A 03/26/14 11:10:00 SP A 78a Write cache enable pending [Vault not enabled] 0 ffffffff 4
B 03/26/14 11:10:24 SP B 78a Write cache enable pending [Vault not enabled] 0 ffffffff 4
于是检查Vault Disk的状态:
SPA侧:
-------------------------------------------------------------------------------------------------------------------------------------
MLU TPID ALU FLU RGRP ENCTYPE TYPE PRIV LD CAPACITY CACHE DEFOWN STATE NAVIFRUS
-------------------------------------------------------------------------------------------------------------------------------------
- - - 2048 240 ATA RAID-1 - - 2.0 GB R-- SP-A ENA 0.0.0 0.0.1 0.0.2
- - - 2052 241 ATA RAID-3 - - 800 MB --- SP-A RDY* 0.0.0 0.0.1 0.0.2
SPB侧:
-------------------------------------------------------------------------------------------------------------------------------------
MLU TPID ALU FLU RGRP ENCTYPE TYPE PRIV LD CAPACITY CACHE DEFOWN STATE NAVIFRUS
-------------------------------------------------------------------------------------------------------------------------------------
- - - 2048 240 ATA RAID-1 - - 2.0 GB R-- SP-A ENA:PEER 0.0.0 0.0.1 0.0.2
- - - 2052 241 ATA RAID-3 - - 800 MB --- SP-A BRK* 0.0.0 0.0.1 0.0.2
可以看到RAID 3分区有异常,这台设备可能有过意外掉电,或者硬盘有被意外拔出过。一般出现这种情况需要将case升级至Level 2工程师(主要考虑到SPA一侧看到的LUN状态是RDY*,一般这个表明这个LUN有Dirty Cache未清除),分析后再派现场工程师(CE)上门帮忙恢复。当然你这台设备已经过保了。
既然你有渠道可以下到AX最新的固件,可以让他给你看一下知识库文档emc100840 "Enabling write cache on CLARiiON AX100-Series array with CRU signature or vault load errors"或emc60614 "Enabling write cache on CLARiiON array with CRU signature or vault load errors"中的方法。
如果这台AX仍然在生产环境的话,注意在操作前做好应用的迁移和数据备份。
alpha.cao
7 消息
0
2014年3月27日 00:00
选择7clear cachedirty lu,没效果。是不是vault cache通过7这个选项不能清除。
emc100840 看不到。
再次感谢你的热心支持,这2天为了这个事,麻烦了不少人。要是就此放弃,不甘心。
1个附件
Catch.jpg
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2014年4月4日 05:00
emc100840普通用户无法访问,而emc60614的具体现场操作也不对外公开,所以我这里不方便贴出来,而且这些操作存在有风险。
不过这两篇KB提到的方法都是一样的。你可以试着用序列号开一个SR,让工程师发给你这两篇KB看看。