自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

本地文件系統(tǒng)和分布式文件系統(tǒng)的特點

系統(tǒng) 分布式
現(xiàn)在的文件系統(tǒng)多種多樣,不管是接口、架構(gòu)、部署都有巨大差異,本文總結(jié)了本地文件系統(tǒng)和分布式文件系統(tǒng)以及它們的特點和技術(shù)點。

前言

文件系統(tǒng)是一套實現(xiàn)了數(shù)據(jù)的存儲、分級組織、訪問和獲取等操作的抽象數(shù)據(jù)類型(Abstract data type)(From Wikipedia)。

現(xiàn)在的文件系統(tǒng)多種多樣,不管是接口、架構(gòu)、部署都有巨大差異,本文試圖總結(jié)一下本地文件系統(tǒng)和分布式文件系統(tǒng)以及它們的特點和技術(shù)點。

我試圖用一個極其抽象的圖來描繪本地文件系統(tǒng)和分布式文件系統(tǒng)。(PS: 好吧,結(jié)果就成了下面這個基本沒啥意義的圖。。。。)

專題推薦:回味那些經(jīng)典的分布式文件系統(tǒng)

QQ20130518-1

本地文件系統(tǒng)

本地文件系統(tǒng)主要是指Ext2,Ext3,Btrfs,XFS這類(很難概括,只好舉例子),它們通常提供以下功能:

  1. 擴展性:隨著系統(tǒng)容量的增加保持性能,不隨容量變化而導致性能震蕩。比如一個目錄下的海量文件,在EXT2/3中由于目錄設(shè)計問題會導致較大的性能問題。再比如EXT2/3中的Metadata的占用和inode的劃分可能會導致空間的浪費。
  2. 數(shù)據(jù)一致性
    • Checksum: Checksum與對應的數(shù)據(jù)塊分開放置,避免silent corruption
    • COW事務: COW事務參考文件系統(tǒng)特性 – COW事務
    • Log: Log被一些文件系統(tǒng)用作WAL模式來加快寫操作,并且保證寫操作的原子性
  3. 多設(shè)備管理:傳統(tǒng)上Linux往往使用LVM進行多設(shè)備的管理,現(xiàn)代文件系統(tǒng)往往增加對多設(shè)備的支持。如ZFS和Btrfs會有存儲池模型對應LVM的邏輯卷組,文件系統(tǒng)會對底層的多設(shè)備進行并行的訪問。
    • 快照和克隆:采用COW事務模型的文件系統(tǒng)通常具有這個特性
    • 軟件RAID支持:現(xiàn)代文件系統(tǒng)通過對多設(shè)備的管理可以很好的支持軟件RAID,如Btrfs對Metadata進行RAID1的默認保護
  4. 針對SSD的優(yōu)化: 除了SSD對于隨機讀這一特性的優(yōu)化外,還有對SSD擦除操作的優(yōu)化。另外,SSD在使用容量接近100%時會導致極差的寫入性能,文件系統(tǒng)也可以對SSD的分配策略和重平衡進行一定的優(yōu)化。
  5. 壓縮和加密: 現(xiàn)在的IO速度遠遠跟不上CPU的發(fā)展,因此對磁盤文件進行壓縮讀寫是個很好的選擇,現(xiàn)代文件系統(tǒng)往往支持多種壓縮格式,而且可以支持整個文件系統(tǒng)的加密或者某個文件和目錄的加密
  6. 去重: 文件系統(tǒng)系統(tǒng)去重是個大話題,主要是計算塊的checksum方法或者客戶端計算文件的hash來決定是否是一個新文件。具體參考Deduplication。#p#

分布式文件系統(tǒng)

分布式文件系統(tǒng)的架構(gòu)和實現(xiàn)有非常大的差異,如NFS這種傳統(tǒng)的基于存儲服務器的網(wǎng)絡文件系統(tǒng),基于SAN的GPFS,然后現(xiàn)在的集群式架構(gòu),比如HDFS這種有中心的分布式,如GlusterFS這種無中心分布式,再如Ceph這種部分在內(nèi)核態(tài)部分在用戶態(tài)等等。

QQ20130518-2

    NFS

QQ20130518-5

    GPFS

QQ20130518-3

    HDFS

QQ20130518-4

    GlusterFS

由于架構(gòu)上的差異和本身文件系統(tǒng)的設(shè)計目標,通常分布式文件系統(tǒng)可以根據(jù)接口類型分成塊存儲、對象存儲和文件存儲。如Ceph具備塊存儲(Experiment)、文件存儲和對象存儲的能力,GlusterFS支持對象存儲和文件存儲的能力。而MogileFS只能作為對象存儲并且通過key來訪問。

  1. 擴展能力: 毫無疑問,擴展能力是一個分布式文件系統(tǒng)最重要的特點。分布式文件系統(tǒng)中元數(shù)據(jù)管理一般是擴展的重要問題,GFS采用元數(shù)據(jù)中心化管理,然后通過Client暫存數(shù)據(jù)分布來減小元數(shù)據(jù)的訪問壓力。GlusterFS采用無中心化管理,在客戶端采用一定的算法來對數(shù)據(jù)進行定位和獲取。
  2. 高可用性: 在分布式文件系統(tǒng)中,高可用性包含兩層,一是整個文件系統(tǒng)的可用性,二是數(shù)據(jù)的完整和一致性。整個文件系統(tǒng)的可用性是分布式系統(tǒng)的設(shè)計問題,類似于NOSQL集群的設(shè)計,比如有中心分布式系統(tǒng)的Master服務器,網(wǎng)絡分區(qū)等等。數(shù)據(jù)完整性則通過文件的鏡像和文件自動修復等手段來解決,另外,部分文件系統(tǒng)如GlusterFS可以依賴底層的本地文件系統(tǒng)提供一定支持。
  3. 協(xié)議和接口: 分布式文件系統(tǒng)提供給應用的接口多種多樣,Http RestFul接口、NFS接口、Ftp等等POSIX標準協(xié)議,另外通常會有自己的專用接口。
  4. 彈性存儲: 可以根據(jù)業(yè)務需要靈活地增加或縮減數(shù)據(jù)存儲以及增刪存儲池中的資源,而不需要中斷系統(tǒng)運行。彈性存儲的最大挑戰(zhàn)是減小或增加資源時的數(shù)據(jù)震蕩問題。
  5. 壓縮、加密、去重、緩存和存儲配額: 這些功能的提供往往考驗一個分布式文件系統(tǒng)是否具有可擴展性,一個分布式文件系統(tǒng)如果能方便的進行功能的添加而不影響總體的性能,那么這個文件系統(tǒng)就是良好的設(shè)計。這點GlusterFS就做的非常好,它利用類似GNU/Hurd的堆棧式設(shè)計,可以讓額外的此類功能模塊非常方便的增加。
責任編輯:黃丹 來源: 麥子麥
相關(guān)推薦

2010-11-01 05:50:46

分布式文件系統(tǒng)

2010-06-04 18:45:43

Hadoop分布式文件

2012-09-19 13:43:13

OpenAFS分布式文件系統(tǒng)

2012-09-19 15:05:24

MogileFS分布式文件系統(tǒng)

2010-11-15 13:24:07

分布式文件系統(tǒng)

2013-01-07 10:29:31

大數(shù)據(jù)

2012-08-31 16:04:11

HDFS分布式文件系統(tǒng)

2013-06-18 14:00:59

HDFS分布式文件系統(tǒng)

2012-05-10 15:23:53

分布式文件系統(tǒng)測試

2017-10-17 08:33:31

存儲系統(tǒng)分布式

2012-07-20 14:40:22

2022-09-13 07:51:08

JuiceFS分布式文件系統(tǒng)

2011-07-15 17:48:27

Platform

2020-01-03 08:33:57

Ceph硬件系統(tǒng)

2011-03-16 14:23:38

分布式文件

2012-10-09 16:43:47

FastDFS分布式文件系統(tǒng)

2023-05-05 08:16:56

SeaweedFS分布式文件

2012-05-10 14:04:07

分布式文件系統(tǒng)架構(gòu)

2013-01-09 10:16:09

HDFS

2018-03-01 16:26:30

HDFSHadoop系統(tǒng)
點贊
收藏

51CTO技術(shù)棧公眾號