自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

VMware籌備Serengeti項(xiàng)目 欲推Hadoop虛擬工具

云計(jì)算 虛擬化 Hadoop
作為一家像VMware這樣的服務(wù)器虛擬化供應(yīng)商,其眼中恐怕沒有哪種工作負(fù)載不能(或者說不應(yīng)該),被以抽象形式剝離底層硬件、從而使其變得更具可塑性與便攜性。從這個(gè)角度出發(fā),VMware理所當(dāng)然地把Hadoop作為下一個(gè)進(jìn)軍目標(biāo)——順便賺點(diǎn)經(jīng)濟(jì)回報(bào)。

 作為一家像VMware這樣的服務(wù)器虛擬化供應(yīng)商,其眼中恐怕沒有哪種工作負(fù)載不能(或者說不應(yīng)該),被以抽象形式剝離底層硬件、從而使其變得更具可塑性與便攜性。從這個(gè)角度出發(fā),VMware理所當(dāng)然地把Hadoop作為下一個(gè)進(jìn)軍目標(biāo)——順便賺點(diǎn)經(jīng)濟(jì)回報(bào)。

過去幾年,VMware一直建議稱Hadoop不應(yīng)運(yùn)行于x86服務(wù)器裸機(jī)當(dāng)中。直到一年前,VMware的這種言論才有所止息,并開始著手通過代號(hào)為Serengeti的項(xiàng)目開發(fā)一整套工具,旨在最終加快Hadoop的部署與實(shí)施速度。

Serengeti項(xiàng)目最初亮相于去年六月的Hadoop World大會(huì),它采用Spring Java框架(目前已經(jīng)歸EMC與VMware的子公司Pivotal所有)。這套框架由Java編寫,專門用于Hadoop調(diào)整工作。

服務(wù)器虛擬化技術(shù)在效率方面的優(yōu)勢可謂眾所周知,而且目前已經(jīng)被廣泛應(yīng)用于企業(yè)級(jí)數(shù)據(jù)中心領(lǐng)域。Hadoop方案的效果卻未得到如此廣泛的認(rèn)同,這主要是因?yàn)榕c其它以CPU利用率為主要難點(diǎn)的通用服務(wù)器工作負(fù)載不同、大數(shù)據(jù)處理有著自己的一套資源要求。大家都知道,Hadoop對(duì)于I/O及存儲(chǔ)容量的要求更嚴(yán)苛(CPU要求則相對(duì)較低),因此提高CPU利用率無法給Hadoop方案帶來任何幫助;事實(shí)上,這可能反而會(huì)擾亂Hadoop集群節(jié)點(diǎn)中磁盤驅(qū)動(dòng)器與CPU核心間的平衡關(guān)系。

不過虛擬化技術(shù)卻正是解決這一難題的良方。它不僅能夠維持計(jì)算與存儲(chǔ)之間的平衡,而且能夠取代處理數(shù)據(jù)所需要的龐大物理設(shè)備——這將顯著提升企業(yè)的運(yùn)營效益,也正是虛擬化技術(shù)的最大優(yōu)勢。

將Hadoop集群中的管理、查詢、數(shù)據(jù)抽象工具以及各種節(jié)點(diǎn)設(shè)備匯總在同一套虛擬機(jī)系統(tǒng)中絕對(duì)是個(gè)好語音,這樣一來整個(gè)體系將可以像其它虛擬基礎(chǔ)設(shè)施一樣實(shí)現(xiàn)復(fù)制與故障轉(zhuǎn)移功能。而對(duì)開發(fā)人員來說,Serengeti項(xiàng)目則足以幫助他們將整套虛擬Hadoop集群安裝在單一物理設(shè)備上,從而簡化編碼、測試等流程,何樂而不為呢?

Serengeti項(xiàng)目概述

更重要的是,我們可以通過對(duì)Hadoop進(jìn)行虛擬化將工作負(fù)載轉(zhuǎn)移至其它虛擬化服務(wù)器池當(dāng)中,從而使Hadoop集群使用與網(wǎng)絡(luò)、應(yīng)用以及數(shù)據(jù)庫相同的基礎(chǔ)設(shè)施,這對(duì)于企業(yè)用戶接納新生方案來說意義非凡。El Reg網(wǎng)站去年就曾撰文指出,優(yōu)秀的虛擬化Hadoop集群應(yīng)用將擁有兩套不同的Task Tracker與JobTracker節(jié)點(diǎn),從而實(shí)現(xiàn)兩套不同Hadoop集群共享同一組數(shù)據(jù)節(jié)點(diǎn),并與單一NameNode協(xié)同運(yùn)作。

NameNode是幫助Hadoop分布式文件系統(tǒng)實(shí)現(xiàn)對(duì)整個(gè)集群內(nèi)非結(jié)構(gòu)化數(shù)據(jù)塊追蹤任務(wù)的關(guān)鍵所在;它類似于磁盤驅(qū)動(dòng)器中的文件分配表。一旦失去NameNode,我們就失去了整個(gè)HDFS;正如沒有FAT,也就沒有磁盤驅(qū)動(dòng)器上的數(shù)據(jù)一樣。

舉例來說,大家可以讓一號(hào)虛擬集群使用物理節(jié)點(diǎn)上的一組副本數(shù)據(jù)而讓二號(hào)虛擬集群使用另一組數(shù)據(jù),這樣整個(gè)集群的數(shù)據(jù)吞吐量就瞬間翻了一倍。

 

VMware籌備Serengeti項(xiàng)目 意欲推出Hadoop虛擬工具

 

Serengeti項(xiàng)目結(jié)構(gòu)圖

Serengeti項(xiàng)目不僅了解如何對(duì)核心Hadoop服務(wù)器進(jìn)行虛擬化及復(fù)制,在處理HDFS之上的HBase數(shù)據(jù)庫倉儲(chǔ)系統(tǒng)方面同樣得心應(yīng)手。它能以主動(dòng)及熱備份副本方式處理HMaster節(jié)點(diǎn)的數(shù)據(jù)倉儲(chǔ)內(nèi)容,更能在數(shù)據(jù)倉儲(chǔ)與HDFS相結(jié)合時(shí)實(shí)現(xiàn)HBase RegionaServer的向外擴(kuò)展。這些功能都已經(jīng)在今年四月Serengeti 0.8.0版本中出現(xiàn)。

現(xiàn)在,VMware正加緊時(shí)間將Serengeti投付生產(chǎn)。在今天于圣何塞舉辦的Hadoop峰會(huì)上,虛擬化巨頭將公布一套ESXi管理程序子集的測試版本以及名為Big Data Extensions的vSphere插件(這是第一款針對(duì)Serengeti的商用支持方案)。VMware公司產(chǎn)品管理高級(jí)主管Fausto Ibarra在接受El Reg網(wǎng)站采訪時(shí)指出,Big Data Extensions將以免費(fèi)形式出現(xiàn)在vSphere的下一個(gè)版本中——“免費(fèi)”這個(gè)詞從VMware嘴里說出來可有點(diǎn)新鮮。預(yù)計(jì)vSphere新版本(可能是5.2)將在8月底的VMworld大會(huì)上亮相,并于秋末正式上市。

大家可以點(diǎn)擊此處下載該插件,并將其與ESXi及vSphere 5.1配合使用。

根據(jù)Ibarra的說明,商用Serengeti軟件無需VMware的分布式資源調(diào)度(簡稱DRS)插件的支持即可直接與ESXi或者vCenter控制機(jī)制協(xié)作,從而在HDFS及HBase上實(shí)現(xiàn)彈性功能。但配合DRS,“它將可以更好地發(fā)揮作用。”其中含義目前尚不明確。

Big Data Extensions已經(jīng)確定可與開源Apache Hadoop 1.2堆棧、Cloudera CDH 3.X與4.2、MapR 2.1.3、Hortonworks Data Platform 1.3以及Pivotal 1.3全系列并行協(xié)作。#p#

零售商、高科技客戶以及金融機(jī)構(gòu)已經(jīng)開始使用該項(xiàng)目

Ibarra同時(shí)指出,有趣的是客戶們已經(jīng)開始通過兩種途徑接納Serengeti。那些對(duì)ESXi較為熟悉的客戶利用它對(duì)服務(wù)器進(jìn)行虛擬化,從而將Hadoop引入虛擬存儲(chǔ)池。而另一些擁有物理Hadoop集群的客戶則開始嘗試?yán)肰Mware的管理程序及工具對(duì)Hadoop及其它工作負(fù)載進(jìn)行虛擬化。

Ibarra并未透露將Serengeti作為原型方案或引入生產(chǎn)系統(tǒng)的企業(yè)客戶的具體數(shù)量,但大型零售商、高科技產(chǎn)品制造商、金融服務(wù)企業(yè)以及新興企業(yè)已經(jīng)開始在商業(yè)版本推出之前著手嘗試。

鑒于Hadoop的開源特性,Serengeti在起步階段的表現(xiàn)至關(guān)重要。開源項(xiàng)目對(duì)于客戶往往具備強(qiáng)大的吸引力,而Hadoop發(fā)行商Hortonworks、Linux發(fā)行商紅帽以及OpenStack云控制器發(fā)行商Mirantis已經(jīng)準(zhǔn)備聯(lián)手推出Svanna項(xiàng)目,旨在以O(shè)penStack及KVM管理程序?yàn)榛A(chǔ)實(shí)現(xiàn)Hadoop虛擬化。

除了帶來生產(chǎn)級(jí)Serengeti工具前瞻之外,VMware還將在今天公布大型大數(shù)據(jù)處理方案Pivotal HD 1.0發(fā)行版,這是VMware開發(fā)的首個(gè)支持Hadoop Virtual Extensions(簡稱HVE)代碼的商用版本,可以算作贈(zèng)予Apache Hadoop項(xiàng)目的一份厚禮。HVE不僅能使Hadoop模塊實(shí)現(xiàn)虛擬化識(shí)別能力,更是Serengeti良好起效的必要前提。

下面我們通過實(shí)例看看HVE的工作機(jī)制。如果大家在Hadoop集群中擁有兩個(gè)虛擬數(shù)據(jù)節(jié)點(diǎn),且二者處于同一臺(tái)物理服務(wù)器當(dāng)中,那么它們彼此能夠識(shí)別出對(duì)方的存在;這意味著它們可以通過內(nèi)存總線進(jìn)行通信,從而獲得比傳統(tǒng)虛擬化網(wǎng)絡(luò)端口更快的溝通速度。

再來看另一個(gè)例子。Hadoop習(xí)慣為數(shù)據(jù)塊保留三份副本,這主要是出于性能及可靠性的考量。HVE會(huì)將其中兩份數(shù)據(jù)副本保存在同一臺(tái)物理服務(wù)器當(dāng)中,但對(duì)于第三份副本則會(huì)刻意保存在另一臺(tái)位于其它機(jī)架中的服務(wù)器端。

Ibarra表示,HVE代碼是Apache Hadoop項(xiàng)目的一部分,所有發(fā)行版都將在未來幾個(gè)月內(nèi)將其納為自身方案的組成部分。我們還不清楚HVE會(huì)對(duì)Savanna項(xiàng)目造成何種影響,但它也許能夠以相同的方式與KVM及OpenStack相對(duì)接。

 

通過上周MapR Hadoop發(fā)行版及數(shù)周前Cloudera的認(rèn)證,Pivotal HD 1.0已經(jīng)確定能夠運(yùn)行在ESXi環(huán)境下。目前Hortonworks發(fā)行版是否受到支持還沒有定論,但鑒于Savanna項(xiàng)目與Serengeti/BDE的競爭關(guān)系,二者之間恐怕很難攜起手來。

責(zé)任編輯:老門 來源: 至頂網(wǎng)
相關(guān)推薦

2012-06-15 09:22:56

VMware

2013-04-08 09:32:23

VMwareSerengetiHadoop

2013-08-02 10:47:56

Hadoop大數(shù)據(jù)存儲(chǔ)SAN

2011-08-15 10:25:56

Vmware微軟Azure開源虛擬化

2009-02-24 19:29:18

VMWare紅帽虛擬化

2011-09-01 14:56:47

VXLAN云計(jì)算虛擬化

2009-05-15 17:31:47

微軟SilverlightRIA

2009-03-02 18:00:41

VMWareRedHat虛擬化

2010-12-01 10:54:51

VMware Thin

2014-07-02 16:06:07

VMwareHadoop

2014-06-27 10:14:01

VMware

2012-02-21 13:13:21

卡巴斯基VMware虛擬化

2010-10-20 10:13:58

VMwareProject HorCitrix

2013-07-08 09:50:22

VMwareHadoop虛擬化

2009-11-04 09:45:23

思科、EMC、VMwaVblock

2013-09-18 10:53:40

Hadoop虛擬化

2013-01-31 11:55:16

ThinApp應(yīng)用虛擬化

2010-05-17 09:52:55

虛擬化VMware Play

2009-07-16 15:16:55

VMware負(fù)載均衡

2011-11-02 09:45:12

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)