自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

HDFS、Ceph、GFS、GPFS、Swift、Lustre……容器云選擇哪種分布式存儲(chǔ)更好?

存儲(chǔ) 存儲(chǔ)軟件 分布式
容器云在使用分布式存儲(chǔ)時(shí),HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ)哪種更好?

[[315604]]

容器云在使用分布式存儲(chǔ)時(shí),HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ)哪種更好?

公司在進(jìn)行容器云技術(shù)選型,想了解相應(yīng)的分布式存儲(chǔ)如何匹配,HDFS、CEPH、GFS、GPFS、Swift等分布式存儲(chǔ),采用哪種更好,主要場(chǎng)景是容器存儲(chǔ)應(yīng)用日志、配置文件、非結(jié)構(gòu)化數(shù)據(jù)文件等。

問(wèn)題來(lái)自@yin986 某保險(xiǎn)軟件架構(gòu)設(shè)計(jì)師,下文來(lái)自twt社區(qū)眾多同行實(shí)踐經(jīng)驗(yàn)分享。

@Steven99 軟件架構(gòu)設(shè)計(jì)師:

日志文件隨著時(shí)間會(huì)是個(gè)很大的量,所以建議考慮統(tǒng)一的日志中心存儲(chǔ)處理,可以用es等,備份到hdfs。

配置文件在量上通常不是個(gè)問(wèn)題,可以考慮配置中心統(tǒng)一管理,無(wú)需額外存儲(chǔ)。

非結(jié)構(gòu)化數(shù)據(jù)通常是大量的文件,可以采用傳統(tǒng)nas或分布式對(duì)象存儲(chǔ),當(dāng)然資金充??梢圆少?gòu)好的存儲(chǔ),存儲(chǔ)性能很重要,根據(jù)業(yè)務(wù)重要程度選擇不同的存儲(chǔ)。

@Garyy 某保險(xiǎn)系統(tǒng)工程師:

容器存儲(chǔ)的持久化,對(duì)于有狀態(tài)數(shù)據(jù)的容器使用場(chǎng)景來(lái)說(shuō)至關(guān)重要。因此,在技術(shù)選型的時(shí)候,需要明確存儲(chǔ)的具體需求。存儲(chǔ)按照數(shù)據(jù)類(lèi)型來(lái)分,可以分為塊存儲(chǔ),對(duì)象存儲(chǔ),文件存儲(chǔ)。我們傳統(tǒng)的環(huán)境中,使用最多的還是塊存儲(chǔ)和文件存儲(chǔ)。隨著IT的更新?lián)Q代,現(xiàn)在對(duì)于對(duì)象存儲(chǔ)(非結(jié)構(gòu)化數(shù)據(jù))的需求日益旺盛,對(duì)象存儲(chǔ)在對(duì)一些Key-Value型數(shù)據(jù)的存儲(chǔ)有著天然的優(yōu)勢(shì),再加上其分布式,副本/糾刪碼等可以匹配傳統(tǒng)存儲(chǔ)的特性,日益成為溫?cái)?shù)據(jù)/冷數(shù)據(jù)存儲(chǔ)的不二之選。

HDFS/CEPH/GFS/GPFS/Swift這類(lèi)分布式存儲(chǔ),按照存儲(chǔ)的類(lèi)型來(lái)區(qū)分,HDFS/GPFS/GFS屬于文件存儲(chǔ),CEPH屬于統(tǒng)一存儲(chǔ)--即塊/對(duì)象/文件統(tǒng)一體,Swift屬于對(duì)象存儲(chǔ)-目前屬于OpenStack下面的一個(gè)子項(xiàng)目。

1)HDFS

Hadoop分布式文件系統(tǒng)(HDFS)被設(shè)計(jì)成適合運(yùn)行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)。它和現(xiàn)有的分布式文件系統(tǒng)有很多共同點(diǎn)。但同時(shí),它和其他的分布式文件系統(tǒng)的區(qū)別也是很明顯的。HDFS是一個(gè)高度容錯(cuò)性的系統(tǒng),適合部署在廉價(jià)的機(jī)器上。HDFS能提供高吞吐量的數(shù)據(jù)訪問(wèn),非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用。HDFS放寬了一部分POSIX約束,來(lái)實(shí)現(xiàn)流式讀取文件系統(tǒng)數(shù)據(jù)的目的。

HDFS有著高容錯(cuò)性(fault-tolerant)的特點(diǎn),并且設(shè)計(jì)用來(lái)部署在低廉的(low-cost)硬件上。而且它提供高吞吐量(high throughput)來(lái)訪問(wèn)應(yīng)用程序的數(shù)據(jù),適合那些有著超大數(shù)據(jù)集(large data set)的應(yīng)用程序。HDFS放寬了(relax)POSIX的要求(requirements)這樣可以實(shí)現(xiàn)流的形式訪問(wèn)(streaming access)文件系統(tǒng)中的數(shù)據(jù)。

2)GFS

GFS是一個(gè)可擴(kuò)展的分布式文件系統(tǒng),用于大型的、分布式的、對(duì)大量數(shù)據(jù)進(jìn)行訪問(wèn)的應(yīng)用。它運(yùn)行于廉價(jià)的普通硬件上,并提供容錯(cuò)功能。它可以給大量的用戶提供總體性能較高的服務(wù)。

3)GPFS

GPFS(General Parallel File System ,GPFS) 是 IBM 公司第一個(gè)共享文件系統(tǒng),起源于 IBM SP 系統(tǒng)上使用的虛擬共享磁盤(pán)技術(shù)( VSD )。作為這項(xiàng)技術(shù)的核心, GPFS 是一個(gè)并行的磁盤(pán)文件系統(tǒng),它保證在資源組內(nèi)的 所有節(jié)點(diǎn)可以并行訪問(wèn)整個(gè)文件系統(tǒng);而且針對(duì)此文件系統(tǒng)的服務(wù)操作,可以同時(shí)安全地在 使用此文件系統(tǒng)的多個(gè)節(jié)點(diǎn)上實(shí)現(xiàn)。GPFS 允許客戶共享文件,而這些文件可能分布在不同節(jié)點(diǎn)的不同硬盤(pán)上;它提供了許多標(biāo)準(zhǔn)的 UNIX 文件系統(tǒng)接口,允許應(yīng)用不需修改或者重新編輯就可以在其上運(yùn)行。

4)CEPH

Ceph是一個(gè)可靠地、自動(dòng)重均衡、自動(dòng)恢復(fù)的分布式存儲(chǔ)系統(tǒng),根據(jù)場(chǎng)景劃分可以將Ceph分為三大塊,分別是對(duì)象存儲(chǔ)、塊設(shè)備存儲(chǔ)和文件系統(tǒng)服務(wù)。在虛擬化領(lǐng)域里,比較常用到的是Ceph的塊設(shè)備存儲(chǔ),比如在OpenStack項(xiàng)目里,Ceph的塊設(shè)備存儲(chǔ)可以對(duì)接OpenStack的cinder后端存儲(chǔ)、Glance的鏡像存儲(chǔ)和虛擬機(jī)的數(shù)據(jù)存儲(chǔ),比較直觀的是Ceph集群可以提供一個(gè)raw格式的塊存儲(chǔ)來(lái)作為虛擬機(jī)實(shí)例的硬盤(pán)。

Ceph相比其它存儲(chǔ)的優(yōu)勢(shì)點(diǎn)在于它不單單是存儲(chǔ),同時(shí)還充分利用了存儲(chǔ)節(jié)點(diǎn)上的計(jì)算能力,在存儲(chǔ)每一個(gè)數(shù)據(jù)時(shí),都會(huì)通過(guò)計(jì)算得出該數(shù)據(jù)存儲(chǔ)的位置,盡量將數(shù)據(jù)分布均衡,同時(shí)由于Ceph的良好設(shè)計(jì),采用了CRUSH算法、HASH環(huán)等方法,使得它不存在傳統(tǒng)的單點(diǎn)故障的問(wèn)題,且隨著規(guī)模的擴(kuò)大性能并不會(huì)受到影響。

5)Swift

Swift 最初是由 Rackspace 公司開(kāi)發(fā)的高可用分布式對(duì)象存儲(chǔ)服務(wù),并于 2010 年貢獻(xiàn)給 OpenStack 開(kāi)源社區(qū)作為其最初的核心子項(xiàng)目之一,為其 Nova 子項(xiàng)目提供虛機(jī)鏡像存儲(chǔ)服務(wù)。Swift 構(gòu)筑在比較便宜的標(biāo)準(zhǔn)硬件存儲(chǔ)基礎(chǔ)設(shè)施之上,無(wú)需采用 RAID(磁盤(pán)冗余陣列),通過(guò)在軟件層面引入一致性散列技術(shù)和數(shù)據(jù)冗余性,犧牲一定程度的數(shù)據(jù)一致性來(lái)達(dá)到高可用性和可伸縮性,支持多租戶模式、容器和對(duì)象讀寫(xiě)操作,適合解決互聯(lián)網(wǎng)的應(yīng)用場(chǎng)景下非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)問(wèn)題。

@fanyqing 某銀行 高級(jí)工程師:

1)Ceph的特點(diǎn)

Ceph支持對(duì)象存儲(chǔ)、塊存儲(chǔ)和文件存儲(chǔ)服務(wù),故稱為統(tǒng)一存儲(chǔ)。

采用CRUSH算法,數(shù)據(jù)分布均衡,并行度高,不需要維護(hù)固定的元數(shù)據(jù)結(jié)構(gòu)。

數(shù)據(jù)具有強(qiáng)一致,確保所有副本寫(xiě)入完成才返回確認(rèn),適合讀多寫(xiě)少場(chǎng)景。

去中心化,MDS之間地位相同,無(wú)固定的中心節(jié)點(diǎn)。

Ceph存在一些缺點(diǎn):

去中心化的分布式解決方案,需要提前做好規(guī)劃設(shè)計(jì),對(duì)技術(shù)團(tuán)隊(duì)的要求能力比較高。

Ceph擴(kuò)容時(shí),由于其數(shù)據(jù)分布均衡的特性,會(huì)導(dǎo)致整個(gè)存儲(chǔ)系統(tǒng)性能的下降。

2)GFS特點(diǎn)

適合大文件場(chǎng)景的應(yīng)用,特別是針對(duì)GB級(jí)別的大文件,適用于數(shù)據(jù)訪問(wèn)延時(shí)不敏感的搜索類(lèi)業(yè)務(wù)。

中心化架構(gòu),只有1個(gè)master處于active狀態(tài)。

緩存和預(yù)取,通過(guò)在client端緩存元數(shù)據(jù),盡量減少與master的交互,通過(guò)文件的預(yù)讀取來(lái)提升并發(fā)性能。

高可靠性,master需要持久化的數(shù)據(jù)會(huì)通過(guò)操作日志與checkpoint的方式存放多份,故障后master會(huì)自動(dòng)切換重啟。

3)HDFS的特點(diǎn)(vs GFS)

分塊更大,每個(gè)數(shù)據(jù)塊默認(rèn)128MB;

不支持并發(fā),同一時(shí)刻只允許一個(gè)寫(xiě)入者或追加者;

過(guò)程一致性,寫(xiě)入數(shù)據(jù)的傳輸順序與最終寫(xiě)入順序一致;

Master HA,2.X版本支持兩個(gè)NameNode,(分別處于Active和Standby狀態(tài)),故障切換時(shí)間一般幾十秒到數(shù)分鐘。

HDFS適合的應(yīng)用場(chǎng)景:

適用于大文件、大數(shù)據(jù)處理,處理數(shù)據(jù)達(dá)到 GB、TB、甚至PB級(jí)別的數(shù)據(jù)。

適合流式文件訪問(wèn),一次寫(xiě)入,多次讀取。

文件一旦寫(xiě)入不能修改,只能追加。

HDFS不適合的場(chǎng)景:

低延時(shí)數(shù)據(jù)訪問(wèn)。

小文件存儲(chǔ)。

并發(fā)寫(xiě)入、文件隨機(jī)修改。

4)Swift特點(diǎn)

原生的對(duì)象存儲(chǔ),不支持實(shí)時(shí)的文件讀寫(xiě)、編輯功能。

完全對(duì)稱架構(gòu),無(wú)主節(jié)點(diǎn),無(wú)單點(diǎn)故障,易于大規(guī)模擴(kuò)展,性能容量線性增長(zhǎng)。

數(shù)據(jù)實(shí)現(xiàn)最終一致性,不需要所有副本寫(xiě)入即可返回,讀取數(shù)據(jù)時(shí)需要進(jìn)行數(shù)據(jù)副本的校驗(yàn)。

是OpenStack的子項(xiàng)目之一,適合云環(huán)境的部署。

Swift的對(duì)象存儲(chǔ)與Ceph提供的對(duì)象存儲(chǔ)區(qū)別:客戶端在訪問(wèn)對(duì)象存儲(chǔ)系統(tǒng)服務(wù)時(shí),Swift要求客戶端必須訪問(wèn)Swift網(wǎng)關(guān)才能獲得數(shù)據(jù)。而Ceph可以在每個(gè)存儲(chǔ)節(jié)點(diǎn)上的OSD(對(duì)象存儲(chǔ)設(shè)備)獲取數(shù)據(jù)信息; 在數(shù)據(jù)一致性方面,Swift的數(shù)據(jù)是最終一致,而Ceph是始終跨集群強(qiáng)一致性)

5)Lustre特點(diǎn)

支持?jǐn)?shù)萬(wàn)個(gè)客戶端系統(tǒng),支持PB級(jí)存儲(chǔ)容量,單個(gè)文件最大支持320TB容量。

支持RDMA網(wǎng)絡(luò),大文件讀寫(xiě)分片優(yōu)化,多個(gè)OSS能獲得更高的聚合帶寬。

缺少副本機(jī)制,存在單點(diǎn)故障。如果一個(gè)客戶端或節(jié)點(diǎn)發(fā)生故障,存儲(chǔ)在該節(jié)點(diǎn)上的數(shù)據(jù)在重新啟動(dòng)前將不可訪問(wèn)。

適用高性能計(jì)算HPC領(lǐng)域,適用于大文件連續(xù)讀寫(xiě)。

幾種主流分布式存儲(chǔ)技術(shù)的特點(diǎn)比較如下: 

 

 

 

責(zé)任編輯:武曉燕 來(lái)源: twt社區(qū)
相關(guān)推薦

2019-06-20 08:59:51

HDFSCEPHGFS

2015-10-19 11:41:30

分布式存儲(chǔ)HDFSGFS

2018-01-30 09:07:36

Ceph分布式存儲(chǔ)

2018-11-15 12:35:25

Ceph分布式存儲(chǔ)

2021-09-03 05:00:28

分布式存儲(chǔ)云原生

2022-08-28 09:05:34

分布式存儲(chǔ)Ceph

2019-04-30 09:17:31

Ceph存儲(chǔ)OSD

2021-10-18 23:49:50

云原生分布式存儲(chǔ)

2021-08-29 23:53:32

存儲(chǔ)Air Gap安裝

2020-10-20 09:38:15

分布式存儲(chǔ)Ceph

2021-07-04 07:07:06

Ceph分布式存儲(chǔ)架構(gòu)

2018-08-02 08:42:57

分布式存儲(chǔ)Ceph

2021-08-07 05:00:20

存儲(chǔ)系統(tǒng)

2018-10-29 12:42:23

Ceph分布式存儲(chǔ)

2023-01-03 07:57:27

2021-08-24 05:02:34

云原生容器分布式

2021-08-26 00:23:14

分布式存儲(chǔ)高可用

2017-10-27 08:40:44

分布式存儲(chǔ)剪枝系統(tǒng)

2022-10-10 17:21:50

固態(tài)硬盤(pán)分布式云存儲(chǔ)

2017-06-06 14:25:54

CentOS 7Ceph分布式存儲(chǔ)系統(tǒng)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)