基于GlusterFS集群文件系統(tǒng)集成系統(tǒng)能稱為“超融合系統(tǒng)(HCI)”嗎?
Gartner認(rèn)為超融合系統(tǒng)是提供共享的計(jì)算與存儲資源的平臺,它基于軟件定義存儲、軟件定義計(jì)算、商業(yè)化的硬件和統(tǒng)一的管理界面。因此,超融合系統(tǒng)是基于通用服務(wù)器資源,計(jì)算、存儲、網(wǎng)絡(luò)和管理的高度融合,而不是簡單的集成。
聯(lián)想針對超融合給出的核心概念就是將兩個或多個組件組合天然地整合在一個獨(dú)立的單元中,而不是簡單地捆綁在一起。例如: Lenovo AIO,Nutanix將計(jì)算和存儲融合到單一節(jié)點(diǎn)中,具有以下優(yōu)點(diǎn):獨(dú)立單元的擴(kuò)展,本地I/O處理,通過融合來消除傳統(tǒng)計(jì)算/存儲的豎井式結(jié)構(gòu)。
現(xiàn)在很多公司的宣稱的超融合產(chǎn)品是: x86平臺 + SSD + 分布式存儲(軟件)+ 高速網(wǎng)絡(luò)。這實(shí)際上只是在硬件上搭建了一套分布式文件系統(tǒng)而已。缺乏針對虛擬化做的特別優(yōu)化,超融合系統(tǒng)中的存儲其實(shí)是一個具有虛擬化感知的動態(tài)存儲體系。
分布式存儲只是構(gòu)成超融合系統(tǒng)的必要條件之一。超融合系統(tǒng)是在同一個服務(wù)器硬件資源上實(shí)現(xiàn)核心的存儲和計(jì)算功能,封裝為單一的、高度虛擬化的解決方案。
GlusterFS是一個開源的可擴(kuò)展的網(wǎng)絡(luò)文件系統(tǒng)。通過它能方便地管理物理環(huán)境、虛擬環(huán)境和云環(huán)境的非結(jié)構(gòu)化數(shù)據(jù)。
它支持文件存儲和對象存儲,具有快照、復(fù)本等數(shù)據(jù)保護(hù)功能,擁有可橫向擴(kuò)展的架構(gòu),支持PB級的數(shù)據(jù)管理。
GlusterFS最初由Gluster提供。Red Hat于2011年收購了Gluster,2014年收購了Inktank(Inktank主要提供基于Ceph的企業(yè)級產(chǎn)品)。
Ceph提供對象、塊和文件三種存儲,GlusterFS只提供文件和對象存儲。Gluster3.8 是今年六月發(fā)布的***版本。
在GlusterFS中,使用彈性哈希算法來計(jì)算數(shù)據(jù)在存儲池中的存放位置。于是數(shù)據(jù)可以很容易的復(fù)制,并且沒有中心元數(shù)據(jù)單點(diǎn)這樣一個容易造成訪問瓶頸的部分。
GlusterFS存儲服務(wù)器(Brick Server)提供基本的數(shù)據(jù)存儲功能,最終通過統(tǒng)一調(diào)度策略分布在不同的存儲服務(wù)器上。數(shù)據(jù)以原始格式直接存儲于服務(wù)器本地文件系統(tǒng)。
在創(chuàng)建存儲池時,需要在主存儲服務(wù)器依次創(chuàng)建附加服務(wù)器的peers,主服務(wù)器不需要添加。
GlusterFS的卷有四種類型:
一、分布式卷(Distributed volume)
又稱哈希卷,近似于raid0,文件沒有分片,文件根據(jù)hash算法寫入各個節(jié)點(diǎn)的硬盤上,優(yōu)點(diǎn)是容量大,缺點(diǎn)是沒冗余。
二、條帶卷(Striped volume)
相當(dāng)于raid0,文件是分片均勻?qū)懺诟鱾€節(jié)點(diǎn)的硬盤上的,優(yōu)點(diǎn)是分布式讀寫,性能整體較好。缺點(diǎn)是沒冗余,分片隨機(jī)讀寫可能會導(dǎo)致硬盤IOPS 飽和。
三、復(fù)制卷(Replicated volume)
相當(dāng)于raid1,復(fù)制的份數(shù),決定集群的大小,通常與分布式卷或者條帶卷組合使用,解決前兩種存儲卷的冗余缺陷。缺點(diǎn)是磁盤利用率低。
四、冗余卷(Dispersed volume)
近似于raid5,文件分片存儲在各個硬盤上,但有部分硬盤用于冗余用途,數(shù)量可以指定。優(yōu)點(diǎn)是在冗余和性能之間取得平衡,缺點(diǎn)是比較新,成熟度不夠。
對于兩節(jié)點(diǎn)的GlusterFS集群,一臺作為主服務(wù)器,一臺作為附加服務(wù)器。當(dāng)出現(xiàn)一臺宕機(jī)時,只有采用復(fù)制卷時,才能保證數(shù)據(jù)不丟失。
如果剩下的單節(jié)點(diǎn)還繼續(xù)對外提供存儲服務(wù),當(dāng)宕機(jī)節(jié)點(diǎn)重新起來以后,將可能導(dǎo)致數(shù)據(jù)不一致。所以,為了滿足可用性的要求,超融合系統(tǒng)通常從三個節(jié)點(diǎn)起步。
因此,兩節(jié)點(diǎn)的Gluster集群只是通過分布式文件系統(tǒng)搭建的SDS的存儲系統(tǒng)。無論從高可用性上,還是從計(jì)算、存儲、網(wǎng)絡(luò)和管理的高度融合上,都達(dá)不到超融合系統(tǒng)的標(biāo)準(zhǔn)。