未解决
此帖子已超过 5 年
2 Intern
•
2.8K 消息
0
34
浅谈GreenPlum产品优势
浅谈GreenPlum产品优势
介绍
作为世界上最强大的分析数据库Greenplum数据引擎,是专为新一代数据仓库所设计的用于大规模数据和复杂查询功能。Greenplum的高性能得益于其基于MPP(并行数据流引擎)和Shared-Nothing结构,并且基于开源软件和X86商用硬件设计,强大的工作效率和低成本的硬件平台为GreenPlum提供了良好的发展和应用前景。
更多信息
目前Oracle、Microsoft、IBM、Teradata和Sybase都发布了自己数据仓库解决方案,相对这些产品小编认为GreenPlum具备以下优势。
架构优势
GreenPlum采用的是shared-Nothing架构,该架构是指一个系统(网站)中的每一个节点(应用服务器)都是互相独立的,彼此之间没有竞争或冲突。在传统的应用独立型架构中如:Oracle RAC数据仓库系统采用的shared-disk架构,传统架构的性能取决于“短板”节点;而在SNA中,系统的性能是其所有节点性能的总和。千言万语不如结构图一张,相信结构对比图能让大家看出Shared-Nothing结构的优势。
(并行数据流引擎)
GreenPlum数据引擎是一款真正意义上的并行数据流引擎,利用原生MapReduce模型实现业界效率最高的并行处理引擎。在引擎中全部SQL逻辑都可以并行在每一个Segment Node执行,负载根据Segment Node数量自动均衡,DB2 DPF中只有主节点可以执行SQL逻辑,Oracle Exadata需要数据搬迁到RAC Server中执行SQL逻辑。在系统内部,Greenplum通过自己的并行数据流引擎来实现更多计算需求的硬件资源调度。
目前业界最快并行加载速度 > 10TB/Hr,并行加载技术充分利用分布式计算和分布式存储的优势,保证发挥出每一块Disk的I/O资源,对比串行加载,并行加载的速度提高40到50倍以上,减少ETL窗口时间,而且通过增加Segment和ETL Server,并行加载速度还将呈线性增长,让我们看看使用并行加载的GreenPlum和同类产品的性能对比图吧。
动态在线扩容
GreenPlum动态在线扩容技术可以保证客户在扩容期间不宕机,这样保证了系统中增加节点服务器即可增加处理性能、存储容量和加载性能。当系统扩展时,数据仓库保证在线,并完全可用,扩展进展在后台运行,从而实现增加节点服务器,性能和容量线性增加。
最大集群规模
Greenplum数据库软件被业界认可为扩展能力最大的分析型数据库软件。目前,全球已有100多家世界级重大客户采用该软件,例如:纳斯达克、AIG、eBay、淘宝、支付宝、中国电信等。这些客户中大多数Greenplum数据仓库所管理的数据量都超过100TB,其中全球最大的6500TB,中国最大的有400TB。
总体成本优势
利用Greenplum解决方案,企业可以避免潜在的严重风险,减低信息管理所产生的巨大成本,同时又能充分利用信息的价值来实现业务优势。对比传统数据库技术高昂的使用维护成本造成的成本负担,Greenplum通过提供高性价比,完全基于X86开放架构大规模无共享MPP数据库集群,对比其它产品提供了总体成本优势。
应用于
Greenplum数据库