VMware推Serengeti項目 支持Hadoop虛擬化
VMware于美國時間本周三宣布了Serengeti開源項目,旨在為Hadoop在VMware虛擬化環(huán)境中的使用進行優(yōu)化。
VMware官員稱,給Hadoop這一領先的大數據分析工具賦予云功能,會使其更便捷地部署和管理VMware機器上的各種Hadoop發(fā)行版。
VMware產品管理總監(jiān)Fausto Ibarra稱,“VMware一直在從事云計算和虛擬化的研發(fā),而大數據也是目前最熱門的IT趨勢之一。我們現在要做的是將這些東西聯系在一起。有了這一次的發(fā)布,Hadoop就能成為IT基礎設施中最好的客戶端。”
有專家指出,VMware這一次的發(fā)布,再加上本周和Hadoop有關的一些發(fā)布,將會使Hadoop市場進一步合法化,刺激更多企業(yè)開始探索大數據分析的潛在價值。
利用Serengeti項目,VMware已對在虛擬化基礎設施中運行的Hadoop做了優(yōu)化。盡管Hadoop集群目前已經在某些實例中運行在虛擬機上了,但VMware稱,在其市場領先的虛擬化產品系列中支持Hadoop集群會讓Hadoop更容易在企業(yè)環(huán)境中進行部署。利用虛擬服務器可以更快捷地部署更多的虛擬機,進行彈性擴展,同時又能確保高可用性和高效的硬件使用率。
Hadoop支持的初期計劃是在VMware vSphere虛擬產品上使用,并可與來自Cloudera、MapR、IBM和Greenplum的Hadoop發(fā)行版兼容。Ibarra稱,他們將會繼續(xù)推進Serengeti項目,未來可將支持擴展到新的Hadoop發(fā)行版和功能集。
通過Apache,讓Serengeti項目免費使用時VMware擁抱開源標準的一個趨勢。它的平臺即服務(PaaS)產品,例如Cloud Foundry也是開源項目。Ibarra稱,VMware希望Serengeti項目能被Hadoop社區(qū)廣泛接受,并與各種Hadoop發(fā)行版兼容。
Ovum分析師Tony Baer認為,Serengeti項目對于讓Hadoop成為企業(yè)友好的工具十分重要。“這將有助于讓Hadoop成為主流工具。”關于Hadoop在虛擬環(huán)境中運行可能帶來的好處已經有了不少的使用案例,例如企業(yè)希望體驗數據集合上的一些新功能,又不想完全披露其集群的情況。
Ibarra稱,VMware官員已經在客戶那里看到了三種主要的Hadoop使用場合:一是企業(yè)正在測試該平臺,而且節(jié)點數少于20個。這次額客戶對于Hadoop的虛擬化發(fā)行版來說是很理想的,因為它不需要較高的資本投入,Hadoop可以在現有的vShpere私有云上運行。
二是客戶將Hadoop的使用擴展到100個節(jié)點左右,這樣更能看到Serengeti項目利用Hadoop所帶來的動態(tài)彈性的優(yōu)勢。第三種使用場合是針對一些早期的Hadoop用戶,他們有數百個節(jié)點,并正在尋求更高級的使用。他說,今天幾乎所有企業(yè)都會從Hadoop的使用中發(fā)現有益的地方,因為每天通過Web流量所產生的非結構數據十分龐大。
451研究集團的云分析師Carl Brooks認為,VMware并非首家讓Hadoop在虛擬機上運行的廠商,所以更有意義的新聞是有更多的廠商正在認識到Hadoop的重要性和發(fā)展?jié)摿?,并開始提供相關服務。例如HortonWorks周二就發(fā)布了可與VMware vShpere兼容的一個Hadoop發(fā)行版。
Ovum的Baer指出,Hadoop目前仍處在企業(yè)采納的初期階段。缺少這方面的技能人才來管理Hadoop集群,解釋Hadoop所生成的數據含義,對于眾多對此好奇的企業(yè)來說都是挑戰(zhàn)。