未解决
此帖子已超过 5 年
2 Intern
•
4K 消息
0
1557
Pivotal HD架构简介
Pivotal HD架构简介
转载请在文首保留原文出处:EMC中文支持论坛 - https://community.emc.com/go/chinese
介绍
今年4月,EMC正式宣布成立独立运营的子公司Pivotal。与新公司重名的产品Pivotal HD即是EMC发布的新的Hadoop发行版本,其中包含一个完全运行于Hadoop数据文件系统(HDFS)之上的大规模并行处理(MPP)数据库,并且与SQL整合以帮助那些不熟悉MapReduce的开发人员和分析师处理海量的数据。
更多信息
Pivotal HD架构:
Pivotal HD支持标准Hadoop发型版本的常用特性(包括HDFS、Pig、Hive、Mahout和Map-Reduce等),但又加入了一些其他的组件,具体如下面结构图所示:
HAWQ:
Pivotal的主要组件是HAWQ,它是一个大规模并行处理(MPP)数据库,借助一种动态流水线机制直接运行于Hadoop中的HDFS之上,其特性包括:
· 兼容SQL——支持各个版本的SQL,包括SQL92、SQL99和SQL 2003 OLAP等。完全兼容PostgreSQL 8.2
· 面向行或面向列的数据存储
· 查询优化器——查询可以运行于成千上万个节点上
· 完全兼容ODBC/JDBC
· 交互式查询——大数据集上的复杂查询可以以秒级或次秒级的速度解决
· 数据管理——提供了表统计和表安全等功能
· 支持存储在HDFS、Hive、HBase、Avro、ProtoBuf、分隔的文本和序列化文件中的数据
· 深度分析——包含了数据挖掘和机器学习算法
Hadoop虚拟化扩展:
Hadoop虚拟化扩展(Virtualization Extension)允许在公共云或者企业内部的VMware虚拟化平台上启用Hadoop集群。HVE让客户在访问Hadoop数据时拥有灵活的部署和高可用的架构。
可插拔的HDFS存储:
除了可以使用标准的Hadoop直连存储来增加存储空间,用户还可以使用EMC Isilon OneFS Scale-Out NAS存储。Isilon OneFS提供了线性加载、备份、复制、快照和弹性扩容等特性。
Pivotal HD (HAWQ)的优势:
据测试,HAWQ比常见的数据仓库查询工具Hive和Impala都要快上不少:
Pivotal HD产品版本:
· Pivotal HD Enterprise: 一个企业级的,提供商业化支持的Apache Hadoop发行版,目前客户是传统的Hadoop部署环境。
· Pivotal Advanced Database Services:基于大规模并行处理的SQL处理能力,提供对Hadoop数据的相关性和分析处理能力。
· Pivotal HD Community: 供免费下载的Pivotal HD Enterprise发行版,供测试、教育或对Pivotal产品的评估使用。
参考
《Pivotal HD Datasheet》
《HAWQ Whitepaper》
《Use Bid Data Technologies to Modernize Your Enterprise Data Warehouse》
应用于
Pivotal HD
liulei_it
2 Intern
2 Intern
•
3.2K 消息
0
2013年7月5日 01:00
好像oracle也有类似的架构产品
Roger_Wu
2 Intern
2 Intern
•
4K 消息
0
2013年7月5日 02:00
Oracle Big Data Connector?