开始新对话

此帖子已超过 5 年

Solved!

Go to Solution

4484

2013年3月9日 05:00

请教Control Station故障切换后登陆的问题,VNX 5300,谢谢!!

​VNX 5300(file)存储系统,双控制站。​

​昨天尝试了CS控制站的故障切换,原CS0管理IP能正常访问登陆,模拟断电故障,拔掉CS0的电源,理应是fail over到CS1,,过了一段时间:​


​CS0断电:​

​1,直连:CS1管理IP可以通过​​直连​​登陆管理,​​可以ping通CS1,SPA,SPB;​

​2,网络、交换机:通过​​网络之后(办公内网,交换机,跨网段)​​不能登陆,登陆界面正常,但是​​登陆时停留在(正在启动服务)Starting Services,此时​​能ping通CS1,但是ping不通SP;​


​CS0重新加电:​

​过一会,通过CS1能登陆管理存储​​(通过办公网络连接,交换机,跨网段)​​,此时能ping通CS1,CS0,SPA,SPB。​


​这个fail over有问题吗?怎么CS0断电的后fail over了,CS1能直连登陆管理却不能通过网络登陆?甚至只能ping通CS1却ping不通SP?很是不解,求解!​

​非常感谢!!​

2 Intern

 • 

2.8K 消息

2013年3月11日 22:00

楼主,首先我想说这次CS的主备切换是成功滴,其中出现的奇怪现象也是正常滴(下面我会详细解释)。目前NAS服务运行在CS1上,需要在CS1上使用root帐号登录,通过命令/nasmcd/sbin/cs_standby -failover才能重新让CS0成为主用设备。

下面解释在其它网段ping不同SPA和SPB的原因,我的环境:双CS的VNX设备,

CS0地址:10.32.23.55
CS1地址:10.32.23.56
SPA地址:10.32.23.57
SPB地址:10.32.23.58.

为了便于理解,解释一下客户端访问CS和SP的工作原理。VNX集成型设备中,CS和SP之间运行着proxy arp协议,即访问SP必须通过CS来解释,即:

PC ----> cs -----> sp (CS通信故障,只能通过网线直连SP口访问)

正常情况下,不同网段PC客户端访问CS和PC正常。

CS0断电,不同网段PC客户端无法访问CS0、SPA和SPB,在PC客户端跟踪CS0和SPA地址路径,发现所有数据包只能到达地址10.32.80.142,该地址为实验环境中连接CS的路由器地址。

a_1.jpg.bmp

a_2.jpg

CS0恢复正常,不同网段PC客户端访问CS0、SPA和SPB恢复正常,在PC客户端对CS0和SPA地址进行跟踪,具体路径见图:

a_3.jpg

a_4.jpg

楼主是否发现客户端访问SPA时,数据流如下:

PC ----> 路由器 ----> CS0 ---->CS1 ---->SPA

为什么数据流要经过CS0呢?因为路由表刷新需要时间,原路由表中记载的是CS0 ----> SPA,所以当CS0断电后,无法访问SPA。

1.6K 消息

2013年3月9日 18:00

貌似是楼主的本论坛第一帖,呵呵。静待周一大拿来回复

13 消息

2013年3月9日 21:00

是呀,新来的,多多关照哈!!

2 Intern

 • 

2.8K 消息

2013年3月10日 22:00

使用双CS时,如果控制站出现故障,各个Data Mover将继续响应用户请求,用户对数据的访问不中断。如果主控制站因为任何原因离线:辅助控制站将自动接管所有控制站功能。VNX系统使用CallHome或Email Home应用工具向EMC客户服务通知该事件。

在正常情况下,主控制站执行故障切换后,您可以继续将辅助控制站作为主控制站使用。在控制站直接重新启动或者因为断电而重新启动之后,您需要使用cs_standby命令,手动恢复主控制站和辅助控制站的角色。从楼主描述的现象看,可能主备Control station配置没有成功,可否将命令/nas/sbin/getreason的输出贴出来给我看一下吗?

22 消息

2013年3月10日 22:00

等待更深入的分析和答案,谢谢。

13 消息

2013年3月10日 22:00

需要把主控制站切换到原来的CS0吗?

2 Intern

 • 

2.8K 消息

2013年3月10日 23:00

通过对楼主的描述分析,我认为在拔掉CS0的电源后,主备CS没有发生切换,CS0电源恢复后服务还是跑在CS0上,因此不需要使用命令切换。我建议您把命令/nas/sbin/getreason的输出结果贴给我看看,以便进一步分析故障原因。

13 消息

2013年3月10日 23:00

但是在CS0断电后,CS1通过直接连接是可以登录管理存储……

只是通过网络之后却不能登陆了,如上面所述,两个SP的IP不能ping通,仅能ping通CS1控制站。

13 消息

2013年3月11日 00:00

命令可能要明天才能尝试……

PC和CS之间没有防火墙,交换机有做vLAN,不过试过将连接CS1和CS0的网线对换,同样是CS1不能登陆,CS0断电前可在工作网络正常登陆,而且后来CS1在CS0重新启动完成后能登陆管理,能不能说明网络是没有问题的?

2 Intern

 • 

2.8K 消息

2013年3月11日 00:00

双CS配置正确的情况下,命令输出如下:

# /nas/sbin/getreason

10 - slot_0 primary control station

11 - slot_1 secondary control station

5 - slot_2 contacted

5 - slot_3 contacted

通过直连网段可以管理CS1,那么就要从连通网络找问题,PC和CS之间是否有防火墙?

2 Intern

 • 

2.8K 消息

2013年3月11日 01:00

在VNX的双CS环境中,楼主是通过Unpshere还是命令行同时登录到CS0和CS1呢?

2 Intern

 • 

2.8K 消息

2013年3月11日 02:00

为了更全面的了解楼主的问题,请回答我几个问题:

(一)测试期间(CS0断电)CS1不能登陆,但能ping通;

在这个阶段,直连网端主机能否登录CS1的Unisphere管理设备?直连网段主机能否ping通SP地址?其它网段主机能否通过Unishere登录CS1?其它网段主机能否ping通SP地址?

(二)测试后(CS0重新加电)CS1可以登陆,CS0不能。

CS0加电后,直连主机通过Unisphere是否能够登录CS0?其它网段主机能够通过Unisphere登录CS1?其它网段主机能否ping同SP地址?目前VNX是通过CS0地址还是CS1地址管理?

谢谢!

2 Intern

 • 

2.8K 消息

2013年3月11日 02:00

那就奇怪了,正常情况下VNX的双CS中,只有一台CS起了NAS服务,备用CS只是一台Linux主机,无法使用图形登录。

13 消息

2013年3月11日 02:00

Unisphere WEB管理界面。

13 消息

2013年3月11日 02:00

测试前是CS0可以登陆;

测试期间(CS0断电)CS1不能登陆,但能ping通;

测试后(CS0重新加电)CS1可以登陆,CS0不能。

找不到事件!

Top