入门级和中端
消息
此帖子已超过 5 年
Solved!
Go to Solution16 消息
0
3243
2013年12月9日 19:00
NEW VNX做NAS机头的高可用
请问大伙,最新一代的VNX,NAS机头如果非常重要,要做到多台的高可用,是用什么技术实现的呢?
是都能主动侦测呢,还是发生故障后另外一台接管。是否需要重启NAS机头,也就是服务会不会断开?
回复(7)
此帖子已超过 5 年
16 消息
0
3243
请问大伙,最新一代的VNX,NAS机头如果非常重要,要做到多台的高可用,是用什么技术实现的呢?
是都能主动侦测呢,还是发生故障后另外一台接管。是否需要重启NAS机头,也就是服务会不会断开?
Top
Jeffey1
2 Intern
2 Intern
•
2.8K 消息
0
2013年12月9日 20:00
在大多数的Celerra,VNX的Data Mover配置中,出于高可用性的需求,最常见的配置都会配置至少一个备用Data Mover,当主DM发生了问题或者因为管理维护需要而重启的时候,主备切换就可能发生以保证用户的数据访问。然而Data Mover的主备切换到底是做了什么?对用户又有什么样的影响?需要花多长时间才能完成呢?下文就这3个问题做了一定程度的解析。
DM发生failover的过程:
1.Data mover上发生failure
2.CS检测到这个failure
3.CS重新配置系统以使备用的DM接管发生问题的DM的业务和身份(包括名字,ip,MAC地址等各种配置);并且CS还将发生问题的DM重启,然后载入一个基本的配置(没有load任何配置或挂载任何文件系统),这么做是为了避免两个DM都load配置尝试去接管生产从而发生“精神分裂”的情况。
4.寂寞地等待了许久的备份DM,终于等到主DM发生问题,可以大展拳脚,于是它顶掉了原配,开始首先初始化一些自身的配置(例如转载各种driver,打开自己的网卡,给它们分配好IP地址,根据parameter配置文件设置各种参数等),紧接着初始化一些外部部署的配置(包括挂载文件系统,设置CIFS server等)。
5.此时DM的failover算是完成了。理论上用户即应该可以访问数据。取决于用户的客户端(以及使用的协议),failover所花的时间可能会对用户体验造成不同的影响。例如windows用户势必需要重新login一次share(当然如果用户是使用应用程序在访问或者映射了网络盘,这个重新登录的过程会由应用程序或操作系统自动完成,而用户只感到顿卡),重新login的原因是备份的DM只会继承配置文件中的配置,而不会继承用户之前login到share时记录在DM内存里的缓存,这些缓存会随着DM重启而消失;而对于Linux的用户,默认的mount方式会不断的尝试通过NFS将文件系统mount起来,因而经历过几次timeout之后,Linux用户就又恢复使用了。
推荐你看看文章:https://community.emc.com/community/support/chinese/storagehw/blog/2013/10/21/celerravnx-file-data-mover-%E4%B8%BB%E5%A4%87%E5%88%87%E6%8D%A2%E7%9A%84%E8%BF%87%E7%A8%8B%E4%BB%A5%E5%8F%8A%E5%88%87%E6%8D%A2%E7%9A%84%E6%97%B6%E9%97%B4%E5%BC%80%E9%94%80
请点击此处免费订阅论坛每月简报
o17Uu33DCF12520
2 Intern
2 Intern
•
1.1K 消息
1
2013年12月9日 20:00
创建一个备用Data Mover(机头)可确保持续访问文件系统。当主DM故障切换到备用DM,备用DM延续失败的DM的身份和功能。可以配置一个备用DM服务于多个主DM。如果主DM中的一个失败了,备用DM继承失败的主DM的IP和MAC地址和功能。原来的备用DM现在是一个主DM,且不再处于待机状态。
为了检测DM故障,control station监控所有的DM的周期性心跳数据,通过冗余的内部网络,CS连接到每个DM。如果CS检测到故障时,根据创建备份关系时建立的策略类型作出响应。如果CS没有运行,则不会发生DM故障切换。
备用DM在失败发生后的几秒钟内延续用户文件系统服务(如果策略设置为自动),透明地,并且不需要用户卸载并重新挂载文件系统。
更多信息和详细配置可参考最新的VNX FILE 8.1的文档:
https://support.emc.com/docu48455_Configuring-Standbys-on-VNX-8.1.pdf?language=en_US
luyg24
222 消息
0
2013年12月10日 17:00
一主一备即可,主的坏掉了,备用的可以接管。
CHUAN-1985
16 消息
0
2013年12月17日 17:00
谢谢大家的热心解答,基本明白整个流程了。
liulei_it
2 Intern
2 Intern
•
3.2K 消息
0
2013年12月17日 18:00
为什么都叫机头呢?
zhouzengchao
2 Intern
2 Intern
•
1.4K 消息
0
2013年12月17日 18:00
可能是因为有“机尾”(后端块级存储,比如Symm/VNX/CLARIION)吧。
Jeffey1
2 Intern
2 Intern
•
2.8K 消息
0
2013年12月17日 18:00
因为机头后面都要接block级别存储,如:Symmetrix或VNX-Block。