什么是存儲?分享學(xué)習(xí)存儲的心得
小編自接觸存儲以來,一直沒有對存儲進(jìn)行分類,感覺它的知識界限并不是那么的明顯,如果單單把它歸為一類的話確實(shí)有點(diǎn)牽強(qiáng)。
它有自己的知識主體也有其他內(nèi)容的涵蓋,所以我認(rèn)為存儲的內(nèi)容比較廣泛和零散,概念比較多,下面我就分享一下學(xué)習(xí)存儲的心得。
一、首先要了解一些基本的概念
1、什么是數(shù)據(jù)及數(shù)據(jù)與信息的區(qū)別:數(shù)據(jù)可以理解為對所有事物的數(shù)字表示,信息是經(jīng)過加工處理的數(shù)據(jù),它是在數(shù)據(jù)層面上經(jīng)過
提煉得出來的有價值的數(shù)據(jù)。其實(shí)這兩個概念都比較簡單,但是非常重要。
2、了解了數(shù)據(jù)及信息的定義后,大家會想這么多的數(shù)據(jù)哪些是有用的呢?數(shù)據(jù)是否有價值是誰來決定的呢?帶著這些問題,我們看一下
三個名詞,分別是:RPO、RTO、和 COT,如果僅僅對這3個名詞進(jìn)行解釋的話效果并不好,會讓你聯(lián)想為死記硬背的概念。所以,我就用通俗易懂的話語來說一下三個名詞的作用:RPO的作用是統(tǒng)計發(fā)生災(zāi)難時我到底丟失了多少數(shù)據(jù);RTO的作用是我想要恢復(fù)丟失
的數(shù)據(jù)需要多長時間;COT的作用是災(zāi)難期間我公司每小時損失的數(shù)據(jù)成本是多少。有興趣的話,大家可以去百度一下這三個名詞縮寫的具體含義。
3、第三個概念是現(xiàn)在比較流行的即ICT,ICT=IT+CT 就是信息技術(shù)與通信技術(shù)的融合。這個也是華為未來的發(fā)展方向。
4、***說一下ICT的基礎(chǔ)架構(gòu),其實(shí)可以理解為存儲的架構(gòu),我們可以簡單的理解為:主機(jī)+網(wǎng)絡(luò)+存儲,隨著學(xué)習(xí)的深入以后會慢慢的豐富這個架構(gòu)。
基本定義說完以后接下來說一下現(xiàn)在存儲里面比較流行的三種解決方案,雖然很多人都聽過但是真正能理解的人卻不算太多。
二、DAS、NAS、SAN
又是三個英文單詞的縮寫,如果想真正理解其含義及作用,必須進(jìn)行單獨(dú)的解析,下面我分別說一下三個名詞。
1、DAS:直連式存儲,可以理解為直接相連的存儲方案。也是最早的存儲設(shè)備,其他的不用多想知道它直連的就可以了。DAS一般分為兩種類型:內(nèi)部DAS和外部DAS,兩者的區(qū)別是依據(jù)于連接位置區(qū)分的。處理器和存儲設(shè)備放在一起的就是內(nèi)部DAS,例如服務(wù)器;處理器和存儲設(shè)備分離的就是外部DAS。DAS有個致命的缺陷就是連接距離***不能超過25m,這個缺陷顯示了DAS的發(fā)展。
2、NAS:網(wǎng)絡(luò)附加存儲,可以簡單的理解為通過網(wǎng)絡(luò)進(jìn)行共享的技術(shù),說白了就是共享服務(wù),NAS常用的共享協(xié)議是NFS和CIFS,前者是類UNIX系統(tǒng)使用的協(xié)議,后者是Windows用的協(xié)議。NAS一般可以分為盤控一體和盤分離,盤指的是存儲陣列,控指的是控制器,一般的NAS設(shè)備最少是雙控(A控+B控)。
3、SAN:存儲區(qū)域網(wǎng)絡(luò),它是DAS的升級版本,隨著數(shù)據(jù)和設(shè)備的增加,DAS已經(jīng)不能滿足工作和生活的需要,所以出現(xiàn)了SAN,它彌補(bǔ)了DAS的不足。這三個技術(shù)的出現(xiàn)順序是DAS早于SAN,SAN早于NAS,是不是有點(diǎn)意外。
第三部分介紹這三個技術(shù)中涉及和使用到的協(xié)議,也是大家比較熟悉的名詞。
三、存儲常用的協(xié)議
1、ATA和SATA:其實(shí)這個定義可以不用記住,因?yàn)槭潜容^老的東西,現(xiàn)在用的也不多,大家了解一下就可以了。
ATA是一種很早就出現(xiàn)的接口類型,后者是前者的改進(jìn)即串行的ATA。
2、SCSI:這個出現(xiàn)的也是比較早,***由IBM公司提出來,前期用于小型機(jī)的接口,全稱叫“小型計算機(jī)系統(tǒng)接口”S(small)C(computer)S(system)I(interface)。后來又衍生出ISCSI。
3、SAS:就是串行的SCSI。
4、FC:光纖通道協(xié)議,它是光纖傳輸使用的協(xié)議。
接下來說一下市場上流行的幾種硬盤,他們各自的特點(diǎn)及區(qū)別。
四、常用的硬盤
1、SATA盤:比較早的硬盤,現(xiàn)在基本不用了,特點(diǎn)是存儲容量大,價格低;缺點(diǎn)是讀取速度慢,不適合頻繁的操作。
2、SAS盤:串行SCSI盤,現(xiàn)在比較流行的盤,特點(diǎn)是讀取速度快,價格適中,性價比高。
3、SSD盤:固態(tài)硬盤,特點(diǎn)是讀取速度極快,價格昂貴,生命周期短暫,性價比底。
4、NL-SAS:近線SAS,盤體采用的SATA,接口采用SAS,結(jié)合了兩者的優(yōu)點(diǎn)于一身,主要用在容量盤中。
下面介紹RAID技術(shù)。
五、傳統(tǒng)RAID技術(shù)
RAID的定義:獨(dú)立磁盤冗余陣列,它的作用主要是容災(zāi)和備份,容災(zāi)可以理解為容許災(zāi)難發(fā)生,備份就不用多說了,也可以理解為數(shù)據(jù)恢復(fù)技術(shù)還有就是保障數(shù)據(jù)的寫入和讀取的效率。
RAID根據(jù)業(yè)務(wù)不同的分為不同的等級:0、1、2、3、4、5、6、10、50等,其中2和4不常用,但是確實(shí)存在,剩下的
是比較常用的RAID級別,下面簡單的說一下幾個RAID的區(qū)別。
1、RAID0: 把數(shù)據(jù)同時寫入2塊硬盤,讀取效率提升50%,沒有備份盤,壞了就完了,不能恢復(fù)和重構(gòu)數(shù)據(jù),作用
僅僅是提高性能。一般單獨(dú)做RAID0的很少。
2、RAID1:把一樣的數(shù)據(jù)分別拷貝到兩個盤上,這兩個盤的數(shù)據(jù)完全一樣,缺點(diǎn)是硬盤的利用率只有50%,優(yōu)點(diǎn)是當(dāng)一個盤壞掉,另一個盤可以正常使用。
3、RAID3:最少需要4個硬盤,其中一個硬盤作為校驗(yàn)盤,具有數(shù)據(jù)校驗(yàn)的功能,所有校驗(yàn)的信息都放到校驗(yàn)盤中。當(dāng)某個數(shù)據(jù)
丟失后,通過其他數(shù)據(jù)和校驗(yàn)盤進(jìn)行異或運(yùn)算推出丟失的數(shù)據(jù),優(yōu)點(diǎn):數(shù)據(jù)丟失后可以恢復(fù),缺點(diǎn):需要額外的校驗(yàn)盤,還有一點(diǎn)就是存在“寫懲罰”。
4、RAID5:RAID3的升級版,去掉了校驗(yàn)盤,所有校驗(yàn)任務(wù)都平均分配到各個盤中,可以理解為分布式存儲,優(yōu)點(diǎn)是數(shù)據(jù)恢復(fù)速度快,不需要校驗(yàn)盤;缺點(diǎn)是:每個盤都參與校驗(yàn),硬盤使用頻率高,損壞的幾率也高。
5、RAID6:繼續(xù)升級,有2塊校驗(yàn)盤,有2種校驗(yàn)?zāi)J?,例如:P+Q校驗(yàn) 和 DP校驗(yàn),優(yōu)點(diǎn)是其他RAID不能比擬的,它允許同時損壞2塊硬盤,是不是很給力。
6、***這個其實(shí)就2個組合:RAID10:先做RAID1,再做RAID0,這種模式性能和效率都很高比較流行。
RAID50:先做RAID5,再做RAID0
下面說一下兩個概念。
六、其他知識
1、大數(shù)據(jù)
SNIA(全球網(wǎng)絡(luò)存儲工業(yè)協(xié)會)對大數(shù)據(jù)下的定義是,在***大的計算平臺上都無法對全部數(shù)據(jù)進(jìn)行有效的處理的數(shù)據(jù)集合。
提到數(shù)據(jù)不得不對其進(jìn)行分類,我們可以簡單的分為2類:結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),當(dāng)然也有人分為三類即增加了半結(jié)構(gòu)化數(shù)據(jù),
在這里我們簡單的分為2類即可。結(jié)構(gòu)化數(shù)據(jù)是指用二維表可以邏輯的表示出來的數(shù)據(jù),例如,Excel、數(shù)據(jù)庫等。非結(jié)構(gòu)化數(shù)據(jù)是不能用二維表邏輯的表示出來,例如,圖片、視頻、文檔等。
2、云計算
云就是互聯(lián)網(wǎng),就是互聯(lián)網(wǎng)計算。它有三種部署模式和三種商業(yè)模式,部署模式有:私有云、公有云和混合云,這里不詳細(xì)的介紹。商業(yè)模式有:IAAS(基礎(chǔ)架構(gòu)就是一種服務(wù))、PAAS(平臺也算是一種服務(wù))、SAAS(軟件也是一種服務(wù))綜上所述云計算就是賣服務(wù)的,就像電力集團(tuán)賣電一樣。
七、RAID2.0+
上面說的RAID是傳統(tǒng)RAID技術(shù),隨著技術(shù)的發(fā)展,主流廠商紛紛提出來新的RAID技術(shù),RAID2.0+是華為推出的,它的核心思想是把數(shù)據(jù)平均分配到每個磁盤上,當(dāng)讀取數(shù)據(jù)的時候所有磁盤都參與進(jìn)來,這樣讀取的速率就會大大的增加。
首先將所有磁盤都劃分為單個的chunk,多個chunk組成一個chunk組(ckg)。從ckg中再細(xì)分成extent,根據(jù)磁盤類型的不同,extent的大小也不一樣。SAS盤和SSD盤中extent的大小為64M,NL-SAS盤extent的大小為256M,所有的extent組成一個卷,從卷中再映射出Lun,呈獻(xiàn)給用戶的就是一個個的Lun,一個Lun就是一個邏輯卷。其實(shí)在extent中還可以繼續(xù)劃分為更小的單位即grain,它是thin Lun的組成單位。