面向海量規(guī)模與高度擴展方向轉(zhuǎn)化的二級數(shù)據(jù)存儲
眾所周知,閃存存儲的速度不斷提高,成本日益降低。它正在快速取代傳統(tǒng)的磁盤存儲 ,在核心存儲中發(fā)揮重要作用,使得關(guān)鍵業(yè)務(wù)應(yīng)用程序性能得到驚人的改善。
今天的數(shù)據(jù)中心內(nèi),現(xiàn)代化的核心存儲陣列中配置大量閃存作為緩存、或是直接部署閃存存儲層,又或者是采取全閃存的架構(gòu)。以往對于閃存損耗的顧慮早已被大部分人所忘卻。還出現(xiàn)了一些新的存儲設(shè)計,例如Datrium充分利用了價格低廉的服務(wù)器端閃存。很顯然,在某些方面,而非全部領(lǐng)域使用閃存,可以得到更佳的IT投資回報。
不過,隨著幾乎每個人都開始在核心存儲中使用閃存,這種在核心存儲上的閃存設(shè)計差異,變得微乎其微。某些時候,只要不是用在金融交易處理上,你很難感受到速度上的差異。
今天大型企業(yè)IT所面對的存儲問題并非辨識哪家的閃存更快、更可靠、更具擴展性或者更加便宜,而是如何充分利用在核心存儲層的投資。追求更高的性能自然會帶來額外的競爭力,但從更普遍的角度來看,業(yè)務(wù)端對處理數(shù)量龐大的運營數(shù)據(jù)集合的需求迅速增長。不論是否運用閃存技術(shù),核心存儲仍然存在并且永遠會存在容量規(guī)劃上的挑戰(zhàn)。
全新“大數(shù)據(jù)”商機
優(yōu)化全新核心存儲的驅(qū)動力促使IT人員盡可能地選用適合的二級數(shù)據(jù)存儲。伴隨著這個新興的“大數(shù)據(jù)”商機,二級存儲市場相應(yīng)發(fā)生著巨大變化。原本僅僅以數(shù)據(jù)保護為目標的離線備份存儲已經(jīng)過時,難以為當前面向用戶的存儲服務(wù)提供日益提升的規(guī)模、速度和交互服務(wù)能力。
我們看到二級存儲架構(gòu)向著高度互動、持久在線模式發(fā)展的趨勢。企業(yè)組織不再只是將備份、快照與歸檔信息儲存在遲緩的近線或本質(zhì)上離線的底層存儲,他們發(fā)現(xiàn)將二級數(shù)據(jù)仍然保留在活躍狀態(tài)能帶來更大的收益。伴隨著二級數(shù)據(jù)存儲向在線模式的轉(zhuǎn)變,終端使用者可以快速檢索并恢復(fù)自己的數(shù)據(jù),就像在Mac計算機上使用Apple Time Machine一樣。同樣,企業(yè)組織能夠從陳舊的冷數(shù)據(jù)集合中獲得到寶貴的信息資產(chǎn),例如大數(shù)據(jù)分析、機器學(xué)習(xí)以及深層次的歷史數(shù)據(jù)檢索。
這聽上去是否有點像是用一種便捷的方式整合了備份與歸檔,就是這樣!數(shù)據(jù)保護備份和恢復(fù)同歸檔之間的差別日益縮小。用這些方式進行備份或許意味著數(shù)據(jù)的變更(例如文件的更改或增量快照),其版本管理從核心存儲復(fù)制到在線的二級數(shù)據(jù)存儲上。恢復(fù)也是在線和交互式復(fù)制的——即時完成所需歷史版本的完整虛擬鏡像,并對最終使用者保持透明。
假如通過數(shù)據(jù)保護算法確保存儲空間足夠大(例如通過N路復(fù)制、糾刪碼和高可用的元數(shù)據(jù)服務(wù)),你便能夠進行更為可靠的歸檔。由此使得歸檔數(shù)據(jù)可以長期保持在線狀態(tài)、即時可用,盡管其性能不及閃存存儲。對于大規(guī)模核心存儲閃存應(yīng)用,這種在線歸檔功能會顯著節(jié)省閃存容量。換而言之,企業(yè)全局在線數(shù)據(jù)存儲空間將變成核心存儲與二級存儲的總和。
主流的二級存儲廠商
包括Cohesity、Hedvig、Igneous Systems、Qumulo、Rubrik和Scality在內(nèi)的幾家供應(yīng)商將其大規(guī)模可擴展存儲定位在數(shù)據(jù)中心的新型輔助存儲。其中的一部分產(chǎn)品在最初設(shè)計中可能只是用于網(wǎng)絡(luò)化規(guī)模、面向下一代的混合云存儲、大數(shù)據(jù)存儲池等的應(yīng)用,但是這些產(chǎn)品都在尋求機會,以幫助企業(yè)組織解決陳舊、復(fù)雜、狹義的數(shù)據(jù)保護的難題。
這些現(xiàn)代化的二級存儲供應(yīng)商并沒有試圖去取代核心存儲空間,或是直接與閃存比較性能。事實上,他們在推動后端系統(tǒng)向公有云轉(zhuǎn)換——例如讓Cleversafe成為IBM的云對象存儲。不過,在某些情況下,他們亦會將傳統(tǒng)核心存儲上的工作負責(如文件服務(wù))降級到所謂的二級數(shù)據(jù)存儲上。
這些較新的二級存儲產(chǎn)品當中,許多都是圍繞著核心對象存儲平臺構(gòu)建的,例如Igneous或大規(guī)模擴展并行文件系統(tǒng),例如Cohesity。有一些定位為軟件定義產(chǎn)品,另一些則作為硬件的優(yōu)化設(shè)計。雖然其部署、性能、可擴展性、限制因素以及各種預(yù)期的使用途徑或許會有天壤之別,但對于二級存儲而言,它們都會具備一些相似的功能,其中包括:
- 用于在線大文件獲取與讀取IO的高性能;
- ***擴展性,能夠支持數(shù)十億,甚至萬億級別的文件與對象;
- 融合混合存儲與分層技術(shù),甚至使用靜態(tài)存儲系統(tǒng),例如Amazon Web Services中的Simple Storage Service and Glacier;
- 全局在線元數(shù)據(jù)索引;端到端的全局命名空間;并在整個存儲空間內(nèi)實現(xiàn)分布式訪問;
- 內(nèi)置存儲分析,從而有助于容量規(guī)劃、使用并實現(xiàn)其它功能;
- 建立策略的自動化引擎可用于細顆粒度的增量備份、歸檔、保留,并實現(xiàn)安全與訪問策略控制;
- 支持直接在線存儲協(xié)議,用于最終用戶訪問并支持下一代網(wǎng)絡(luò)規(guī)模的應(yīng)用程序,包括狀態(tài)轉(zhuǎn)變API(representational state transfer APIs)、直接SMB 共享(, direct SMB share)與NFS掛載(NFS mount)等存儲對象協(xié)議;
- 卓越的數(shù)據(jù)保護,包括使用中與靜態(tài)過程中的信息加密、同步與異步的多路復(fù)制、分布式RAID和糾刪碼,以及高可用的元數(shù)據(jù)保護等功能;
- 通過性能線性的橫向擴展集群能力、全局在線重復(fù)數(shù)據(jù)刪除、智能壓縮以及自動精簡配置和虛擬化克隆,實現(xiàn)了很高的成本效益,使得存儲基礎(chǔ)架構(gòu)能夠面對日益增長的挑戰(zhàn)。
像云供應(yīng)商一樣思考問題
除了單純在閃存上的投資,IT部門應(yīng)當努力變成像云服務(wù)供應(yīng)商那樣。我們一直在為IT客戶提供咨詢服務(wù),建議他們用內(nèi)部服務(wù)供應(yīng)商的方式思考,而非僅僅作為滿足業(yè)務(wù)需求的成本中心。撇開二級存儲的命名,這種全新的存儲設(shè)計的確將云存儲的理念帶入數(shù)據(jù)中心。將其稱為二級確實有所不妥。
將核心存儲升級至閃存可以大幅減輕IT的負擔——例如徹底消除存儲性能的瓶頸——但是在核心存儲上使用閃存在本質(zhì)上并不會改變IT與最終用戶之間的關(guān)系。而這些全新的二級存儲設(shè)計正將IT轉(zhuǎn)變?yōu)闃I(yè)務(wù)的主導(dǎo)者,它徹底改變了最終用戶與存儲進行交互的方式,滿足更多數(shù)據(jù)在線業(yè)務(wù)所需,同時***化了在閃存領(lǐng)域的投資。