快速部署Hadoop基礎架構
據國外媒體消息,為應對海量數據浪潮,VMware啟動Serengeti開放原始碼計劃,便于企業(yè)在VMware vSphere虛擬化平臺上快速部署與管理Apache Hadoop集群,部署虛擬化技術與分布式計算混用的基礎架構。
通過Serengeti計劃,VMware開放一組工具組,可在Apache 2.0網頁免費下載,讓企業(yè)IT人員利用指令接口(Command Line Interface,CLI)在vSphere平臺建立、設定、啟用與管理Hadoop集群,包括Hadoop共通組件如Apache Pig與Apache Hive等。例如,IT人員可用這些工具組設定單臺虛擬計算節(jié)配置多少內存、存儲與網絡資源。目前VMware已和Cloudera、Greenplum、Hortonworks、IBM及MapR等Hadoop廠商合作推廣Serengeti計劃。
此外,VMware還為Hadoop放出新的原始碼,包括HDFS(Hadoop Distributed File System)和Hadoop MapReduce項目的擴展組件,可在虛擬化平臺當中,將數據和計算任務分散到不同虛擬計算節(jié)點。并且VMware發(fā)布了Spring for Apache Hadoop分布式計算開發(fā)平臺的更新版本,讓企業(yè)開發(fā)人員整合HBase數據庫、Cascading函數庫及Hadoop安全功能,來開發(fā)采Hadoop技術的應用系統(tǒng)。