开始新对话

未解决

此帖子已超过 5 年

793

2016年3月18日 00:00

VSAN Stretched Cluster(延伸群集)站点间带宽计算

​ ​
​ ​

​VSAN Stretched Cluster(​​延伸群集​​)​​站点间带宽计算​

​ ​
​ ​

​ ​

​转载请在文首保留原文出处:​​EMC​​中文支持论坛​​https://community.emc.com/go/chinese​​ ​image001.gif

​ ​
​ ​

​介绍​

​ ​
​ ​

​ ​

​ EMC​​联合​​VMware​​推出的新一代超融合系列产品​​VxRail​​是一款基于工业标准​​x86​​服务器,采用​​VSAN​​虚拟化存储技术,能够实现完全自动化配置的超融合产品。我们从​​VxRail​​的产品经理处得知,下一版本的​​VxRail​​将支持双活(​​Active-Active​​)技术,也就是​​VSAN 6.1​​的​​Stretched Cluster(​​延伸群集​​)​​功能。​

​ ​

​ 本文我们将继续介绍如何计算延伸群集中两个数据站点以及见证主机之间的带宽需求。​

​ ​
​ ​

​更多信息​

​ ​
​ ​

​ ​

​通用建议​​:​

​ ​

​ ​

​ 两个数据站点之间的带宽很大程度上取决于​​VSAN​​承担的工作负载、总数据量以及故障场景的处理方式。因此通常的建议参考如下:​

​ ​guide.jpg​ ​
​ ​

​ ​

​数据站点间带宽需求:​

​ ​

​ ​

​ 在真实的业务场景中,全读或者全写的情况很少。更多的时候,用读写比率来衡量业务​​I/O​​特性是常用的办法。以​​VDI​​场景的负载举例子。在负载峰值的情况下,读写比率通常是​​3​​:​​7​​。​

​ ​

​ 例如:业务需要求​​IOPS​​的总量是​​10​​万,读写比率为​​3​​:​​7​​。由于​​VSAN​​延伸群集本地读(​​Read Locality​​)的特性,读操作不需要跨站点,因此考虑数据站点之间带宽只考虑跨站点写即可,也即​​7​​万写​​IOPS​​。​

​ ​

​ 数据站点间带宽计算公式:​

​ ​

​ B = Wb * md * mr​

​ ​

​ B​​:​​Bandwidth​​,数据站点之间的带宽。​

​ ​

​ Wb​​:​​Write Bandwidth​​,数据站点之间的写带宽。​

​ ​

​ md​​: Data Multiplier​​,数据乘数​

​ ​

​ mr​​:​​Resynchronization multiplier​​,再同步乘数​

​ ​

​ 其中,数据乘数​​md​​由​​VSAN​​元数据跨站点写开销等相关的操作组成的(除了数据以外,元数据也需要跨站点写)。​​VMware​​建议将​​md​​这个数值设置为​​1.4​​。​

​ ​

​ 再同步乘数​​mr​​指的是数据站点之间同步事件(例如​​VSAN​​组件的状态信息)的所需要的总开销。​​mr​​这个数值,​​VMware​​建议为​​1.25​​(也即额外增加​​25%)​​。​

​ ​

​ 再同步乘数和数据乘数其实都是跨站点写数据的额外开销。这两个数值使用​​VSAN​​推荐值即可。​

​ ​

​案例分析​

​ ​

​案例​​1​​:​

​ ​

​ VSAN​​运行一个​​IOPS​​为​​1​​万的全写负载业务。写的​​block​​为​​4KB​​。这需要消耗​​40MB/s​​的数据站点间的带宽(​​4KB*10000​​),也就是​​320Mbps​​。​

​ ​

​ 按照上面的计算公式:​​B=320Mbps * 1.4 * 1.25 = 560Mbps ​​;​

​ ​

​ 因此,在这个负载情况下,​​VSAN​​数据站点之间需要的带宽至少应为​​560Mbps​​。​

​ ​

​案例​​2​​:​

​ ​

​ VSAN​​运行负载为​​3​​万全写​​IOPS​​,​​4KB block size​​,这需要​​120MB/s​​(​​960Mbps​​)跨站点写数据的吞吐量。​

​ ​

​ 按照公式:​​B=960Mbps * 1.4 * 1.25 = 1680Mbps ​​,约等于​​1.7Gbps​​;​

​ ​

​ 因此,在这个案例中,数据站点之间的带宽至少应为​​1.7Gbps​​。​

​ ​

​ ​

​数据站点与见证主机站点间带宽需求​​:​

​ ​

​ ​

​ 数据站点并不存放虚拟机的数据,只是用于投票使用,因此数据站点与见证主机站点之间的带宽计算公式与上面的不一样。​​VSAN​​是基于策略驱动的分布式存储。数据是以对象的方式存储在​​VSAN​​中的,一个虚拟机在​​VSAN​​存储中的数据由一个或者多个组件组成,组件有如下类型:​

​ ​

​·​​ ​​虚拟机主目录或命名空间​

​ ​

​·​​ ​​虚拟机​​Swap​​对象​

​ ​

​·​​ ​​虚拟机虚拟硬盘​​(VMDK)​

​ ​

​·​​ ​​快照​

​ ​

​ 在​​VSAN​​中,当一个对象的大小大于​​255GB​​的时候,就会被自动划分成多个组件。仲裁站点与数据站点之间的计算公式如下:​

​ ​

​ 1138 B * NumComp / 5 seconds​

​ ​

​ 1138 B​​这个数字来源于当主站点离线,备站点接管所有组件的所有权时所采取的动作。当主站点离线,备站点将成为主站点。见证主机将会向新的主站点发送确认信息,确认主站点的角色已经发生了变更。​

​ ​

​ 1138 B​​是当主站点离线以后,见证主机站点需要从元数据信息中获取主站点上所有组件已经失效,并且随后由备站点接管所有权的状态信息更新开销。当主站点离线以后,见证主机站点与数据站点之间的带宽应足以让群集中所有部件的主站点所有权的变更在​​5​​秒内完成。​

​ ​

​案例分析​

​ ​

​案例​​1​​:​

​ ​

​ 虚拟机由如下内容组成:​

​ ​

​·​​ ​​三个对象:​

​ ​

​o​​ ​​VM namespace​

​ ​

​o​​ ​​VMKD​​(小于​​255GB​​)​

​ ​

​o​​ ​​VM Swap​​文件​

​ ​

​·​​ ​​Failure to Tolerate (FTT) = 1​

​ ​

​·​​ ​​Stripe Width = 1​

​ ​

​ 以上配置的虚拟机数量是​​166​​个,那么见证主机站点就需要获取到​​996​​个组件信息:​​996=3*2*1*166​​。​

​ ​

​ 为了方便用​​1000​​进行计算:​​B = 1138 B * 8 * 1000 / 5s = 1820800 Bps = 1.82Mbps​​;​

​ ​

​ VMware​​推荐预留​​10%​​的额外带宽用于信息双向传输:​​1.82 * 1.1 = 2.00Mbps​​。因此,在这个场景下,数据站点与见证主机站点的带宽应为​​2Mbps​​。​

​ ​

​案例​​2​​:​

​ ​

​ 虚拟机由如下内容组成:​

​ ​

​·​​ ​​三个对象:​

​ ​

​o​​ ​​VM namespace​

​ ​

​o​​ ​​VMDK​​(小于​​255GB​​)​

​ ​

​o​​ ​​VM Swap​​文件​

​ ​

​·​​ ​​Failure to Tolerate (FTT) = 1​

​ ​

​·​​ ​​Stripe Width = 2​

​ ​

​ 如果具有以上配置的虚拟机数量为​​1500​​,那么仲裁站点将会维持​​18000​​个组件的状态信息:​​3*2*2*1*1500=18000​​。​

​ ​

​ 按照计算公式:​​B=1138 B * 8 * 18000 / 5s = 32.78Mbps​

​ ​

​ ​​B * 1.1 = 36.05Mbps​

​ ​

​ 因此在这个场景下,数据站点与见证主机站点之间的带宽需要​​36.05Mbps​​。​

​ ​

​ 根据上面的案例,我们可以提炼一个简单的公式用于日常的评估,那就是​​2Mbps​​带宽可以支持​​1000​​个组件的状态信息。由此得出支持​​18000​​个组件的更新,所需要的带宽是:​​18000/1000*2Mbps=36Mbps​​。​

​ ​

​ ​

​两节点配置下的见证主机站点带宽需求​​:​

​ ​

​ ​

​ 在​​VSAN6.1​​中,支持​​2​​节点的​​VSAN​​集群:​

​ ​2node.jpg​ ​
​ ​

​案例​​1​​:​

​ ​

​ 假设一个​​2​​节点配置中的虚拟机数量有​​25​​台,每个都有​​1TB​​的虚拟硬盘大小,​​FTT=1​​且​​Stripe Width=1​​。​

​ ​

​ 上面我们提到过​​VSAN​​中一个​​VMDK​​组件最大为​​255G​​,因此每个​​VMDK​​由​​4​​个组件组成,此外由于​​FTT=1​​,在包含副本的情况下,每个​​VMDK​​由​​8​​个组件组成。加上​​VM namespace​​和​​Swap​​文件(有副本),那么一个虚拟机的组件总数为​​12=4*2+2*2​​。​​25​​个虚拟机组件总量为​​300 (12*25)​​。​

​ ​

​ 使用通用公式:​​300/1000*2Mbps=600Kbps​​。因此在这种场景下,数据站点与见证站点之间的带宽为​​600Kbps​​。​

​ ​

​案例​​2​​:​

​ ​

​ 在​​2​​节点配置中,每个主机上有​​100​​个虚拟机,每个虚拟机有​​1TB​​的​​VMDK​​,​​FTT​​和​​SW​​均为​​1​​。那么组件的总量为​​2400​​。​

​ ​

​ 按照通用公式,​​2400​​个组件需要的带宽为​​2400/1000*2Mbps=4.8Mbps​​。因此在这个场景中,数据站点与见证站点之间的带宽需要​​4.8Mbps​​。​

​ ​

​ 需要注意的是,如果部署了​​2​​节点配置那需要给每一个数据站点都预留足够的带宽:​

​ ​combine.jpg​ ​
​ ​

​ 以上面两个案例为例,总的带宽需求是​​5.4Mbps (600Kbps+4.8Mbps)​​。​

​ ​
​ ​

​参考​

​ ​
​ ​

​ ​

​VMware​​技术白皮书​

​ ​

​《​​Virtual SAN 6.1 Stretched Cluster Guide​​》​

​ ​

​《​​VMware Virtual SAN Stretched Cluster Bandwidth Sizing Guidance​​》​

​ ​
​ ​

​应用于​

​ ​
​ ​

​ ​

​VMware Virtual SAN​

​ ​
没有回复!
找不到事件!

Top