Red Hat開源其Hadoop存儲系統(tǒng)
作為大數(shù)據(jù)+混合云業(yè)務(wù)戰(zhàn)略的一部分,Red Hat沒有選擇推出自己的hadoop商業(yè)版本或者收購一家Hadoop發(fā)行廠商,而是推出了首個(gè)Hadoop HDFS文件存儲系統(tǒng)的開源替代產(chǎn)品。
Red Hat本周三宣布開源其Red Hat Storage Hadoop插件,作為HDFS的替代產(chǎn)品。RedHat Storage hadoop插件基于Gluster文件系統(tǒng)——Red Hat于2011年以1.36億美元收購了Gluster,目前已經(jīng)將Gluster的技術(shù)整合到了Red hat的存儲服務(wù)器產(chǎn)品(RHSS)中。Red hat計(jì)劃在今年某個(gè)時(shí)候?qū)⒃摬寮l(fā)布到Apache軟件基金會。
Red Hat在新聞發(fā)布會上表示:
Red Hat存儲產(chǎn)品將企業(yè)級功能帶到了大數(shù)據(jù)環(huán)境,例如異地備份、高可用性、POSIX合規(guī)、災(zāi)備和管理等,而這些不以犧牲API兼容性和數(shù)據(jù)歸屬為代價(jià)??蛻裟壳坝辛艘粋€(gè)統(tǒng)一的可擴(kuò)展存儲軟件平臺來管理部署在不同物理、虛擬、公共或者混合云資源中的文件和對象。
由于實(shí)現(xiàn)了完全的分布式,Red Hat的文件系統(tǒng)能夠取代Hadoop集群中負(fù)責(zé)數(shù)據(jù)追蹤的NameNode,從而消除其性能瓶頸和單點(diǎn)失敗問題。(不過Hadoop社區(qū)已經(jīng)通過Apache hadoop 2.0已經(jīng)改善了NameNode,而Facebook的工程師則開發(fā)出了替代技術(shù)AvatarNode)Red Hat還將其存儲和虛擬化技術(shù)進(jìn)行組合,同時(shí)使用這兩者的用戶將擁有一個(gè)存儲的虛擬池,而計(jì)算資源能駐留在相同的物理基礎(chǔ)架構(gòu)上。
大數(shù)據(jù)的重點(diǎn)不是基礎(chǔ)設(shè)施而是應(yīng)用
除了Red hat,如今很多公司都試圖解決HDFS存在的問題,提高其在大型企業(yè)或者互聯(lián)網(wǎng)公司中的可用性。EMC、NetApp等公司都提出了自己的替代方案。Quantcast甚至開發(fā)并開源了自己的HDFS版本——Quantcast File System。Hadoop的未來取決于能否成功開拓大型企業(yè)市場,而HDFS的替代技術(shù)目前是企業(yè)應(yīng)用的首選,除非Apache hadoop能夠快速跟上。
對于Red Hat來說,開源Hadoop存儲系統(tǒng)只是混合云戰(zhàn)略的一部分,Red Hat表示希望在Hadoop上的努力能夠推動其更宏大的云計(jì)算戰(zhàn)略——讓客戶能夠在混合云計(jì)算的大數(shù)據(jù)環(huán)境中運(yùn)行應(yīng)用,橫跨包括OpenStack和亞馬遜AWS這樣的私有云或公用云環(huán)境。