开始新对话

未解决

此帖子已超过 5 年

1557

2013年7月4日 19:00

Pivotal HD架构简介

Pivotal HD架构简介

转载请在文首保留原文出处:EMC中文支持论坛 - https://community.emc.com/go/chinese

介绍

      今年4月,EMC正式宣布成立独立运营的子公司Pivotal。与新公司重名的产品Pivotal HD即是EMC发布的新的Hadoop发行版本,其中包含一个完全运行于Hadoop数据文件系统(HDFS)之上的大规模并行处理(MPP)数据库,并且与SQL整合以帮助那些不熟悉MapReduce的开发人员和分析师处理海量的数据。

更多信息

Pivotal HD架构:

      Pivotal HD支持标准Hadoop发型版本的常用特性(包括HDFSPigHiveMahoutMap-Reduce等),但又加入了一些其他的组件,具体如下面结构图所示:

pivotal_hd_architecture.jpg

HAWQ

      Pivotal的主要组件是HAWQ,它是一个大规模并行处理(MPP)数据库,借助一种动态流水线机制直接运行于Hadoop中的HDFS之上,其特性包括:

·         兼容SQL——支持各个版本的SQL,包括SQL92SQL99SQL 2003 OLAP等。完全兼容PostgreSQL 8.2

·         面向行或面向列的数据存储

·         查询优化器——查询可以运行于成千上万个节点上

·         完全兼容ODBC/JDBC

·         交互式查询——大数据集上的复杂查询可以以秒级或次秒级的速度解决

·         数据管理——提供了表统计和表安全等功能

·         支持存储在HDFSHiveHBaseAvroProtoBuf、分隔的文本和序列化文件中的数据

·         深度分析——包含了数据挖掘和机器学习算法

hawq_architecture.jpg

Hadoop虚拟化扩展:

      Hadoop虚拟化扩展(Virtualization Extension)允许在公共云或者企业内部的VMware虚拟化平台上启用Hadoop集群。HVE让客户在访问Hadoop数据时拥有灵活的部署和高可用的架构。

可插拔的HDFS存储:

      除了可以使用标准的Hadoop直连存储来增加存储空间,用户还可以使用EMC Isilon OneFS Scale-Out NAS存储。Isilon OneFS提供了线性加载、备份、复制、快照和弹性扩容等特性。

Pivotal HD (HAWQ)的优势

      据测试,HAWQ比常见的数据仓库查询工具HiveImpala都要快上不少:

hawq_hive_impala.jpg

Pivotal HD产品版本:

·         Pivotal HD Enterprise: 一个企业级的,提供商业化支持的Apache Hadoop发行版,目前客户是传统的Hadoop部署环境。

·         Pivotal Advanced Database Services:基于大规模并行处理的SQL处理能力,提供对Hadoop数据的相关性和分析处理能力。

·         Pivotal HD Community: 供免费下载的Pivotal HD Enterprise发行版,供测试、教育或对Pivotal产品的评估使用。

参考

Pivotal HD Datasheet

HAWQ Whitepaper

Use Bid Data Technologies to Modernize Your Enterprise Data Warehouse

应用于

Pivotal HD

2 Intern

 • 

3.2K 消息

2013年7月5日 01:00

好像oracle也有类似的架构产品

2 Intern

 • 

4K 消息

2013年7月5日 02:00

Oracle Big Data Connector?

找不到事件!

Top