超融合架構(gòu):主數(shù)據(jù)存儲使命之外
在主站點上實現(xiàn)的數(shù)據(jù)存儲與工作負(fù)載廣為人知——而與之對應(yīng)二級站點則并非如此。也正因此,近年以來二級站點相比主站點,在體系結(jié)構(gòu)方面發(fā)展甚緩。
按照慣例,數(shù)據(jù)存儲的主站點與應(yīng)用程序直接讀寫、交互數(shù)據(jù);工作負(fù)載的主站點上則負(fù)責(zé)程序運行,但并不一定用于支持最終用戶。一級或二級應(yīng)用程序(如ERP、CRM、Microsoft Exchange與SQL Server等)往往都被視為主站點上關(guān)鍵應(yīng)用程序。在二級站點上,我們一般只會想到數(shù)據(jù)保護(hù)、歸檔、復(fù)制、重復(fù)數(shù)據(jù)刪除、壓縮、加密、分析報表以及二級應(yīng)用的測試和開發(fā),這些應(yīng)用需要使用到那些在主站點中產(chǎn)生,并在二級站點存儲的數(shù)據(jù)。
不過,今天在二級站點領(lǐng)域發(fā)生著翻天覆地的變化,其中充斥著各種晦澀而混亂的概念,大量的供應(yīng)商通常只針對解決某個單一的問題。事實上,直到最近業(yè)內(nèi)才開始從一種統(tǒng)一的視角來觀察以往這些形態(tài)各異的,位于二級站點的應(yīng)用和數(shù)據(jù)。
這些定義并非明晰確鑿的:雖然這聽上去有些奇怪——存儲與應(yīng)用究竟是在主站點還是二級站點上,其邊界相當(dāng)模糊。我們就此展開全文。
從主站點上著手
現(xiàn)在數(shù)據(jù)的二級存儲像主存儲那樣,正在開始經(jīng)歷一種結(jié)構(gòu)性的轉(zhuǎn)變。我們首先總結(jié)歸納出在主存儲端所發(fā)生的事,因為這同樣適用于這場在二級存儲上展開的變革。
煙囪式的主存儲帶來了相當(dāng)大的混亂,對成本、時間效率以及應(yīng)用程序性能所造成的影響數(shù)不甚數(shù)。所幸的是,我們已經(jīng)看到了虛擬化技術(shù)應(yīng)用、橫向擴(kuò)展、融合,以及最近才出現(xiàn)的超融合所帶來的諸多改善。
虛擬化技術(shù)抽象了計算資源,改變了我們提供和管理硬件資源的方式。融合則以集成的方式將計算、存儲、網(wǎng)絡(luò)與虛擬化相結(jié)合,使得基礎(chǔ)架構(gòu)更易于購買、交付和管理。超級融合從本質(zhì)上將計算、存儲和存儲網(wǎng)絡(luò)(SAN、NAS)融合到一個單一的實體和橫向擴(kuò)展的架構(gòu)之中,從而顛覆了整個行業(yè)。
由于超融合技術(shù)消除了IT行業(yè)在過往的三十年內(nèi)一直想要解決的痛點,其成長與發(fā)展遠(yuǎn)未有結(jié)束。例如說,超融合可以減少或消除計算與存儲資源在配置、微調(diào)、交付、管理以及仲裁方面的負(fù)載,并且很快會涉足到網(wǎng)絡(luò)領(lǐng)域。
問題在于……
假如說超融合對數(shù)據(jù)存儲和工作負(fù)載的主站點而言能帶來如此多的收益,那么其能在二級存儲方面發(fā)揮同樣的作用嗎? 雖然超融合有諸多創(chuàng)新,但上述問題的答案是,“不”。
從概念上看這樣做似乎不難。我們應(yīng)該應(yīng)用超融合、橫向擴(kuò)展的文件系統(tǒng)、虛擬化、軟件定義存儲(SDS)等技術(shù),令二級站點像主站點那樣更具效能。
但這著實是一項艱巨的挑戰(zhàn)。我們不禁開始思考是否有可能開發(fā)出一款包羅萬象的產(chǎn)品來囊括所有二級站點上負(fù)載,而非各種功能的胡拼亂湊。
在解決這項難題之前,讓我們先來描繪出這項新的體系結(jié)構(gòu)所要達(dá)成的目標(biāo)。
超融合二級存儲
在Taneja集團(tuán)內(nèi)部,我們已經(jīng)將這種新的體系結(jié)構(gòu)定義為超融合二級存儲。命名規(guī)則相當(dāng)簡單:這類產(chǎn)品應(yīng)用超融合原則,并完全服務(wù)于二級站點的工作負(fù)載。
在開始閱讀我們對這種全新超融合二級存儲概念所做定義時,請注意,有些產(chǎn)品即使缺少某些特定的功能,但它們或許仍然會屬于超融合二級存儲這個范疇。其中的關(guān)鍵點在于,“產(chǎn)品的架構(gòu)是否便于增加新的功能,而非從功能上完全進(jìn)行重構(gòu)?”目前市場上各供應(yīng)商的產(chǎn)品沒有完全符合上述定義:有一些較為接近而另一些則完全不同。所有這些都與主存儲端的超融合技術(shù)發(fā)展完全一致。
另外,你還必須確定缺失的內(nèi)容對你而言是否是至關(guān)重要的。這里所列出的是超融合二級存儲所應(yīng)涵蓋的基本要求:
存儲必須使用節(jié)點的體系結(jié)構(gòu),支持幾近***的“橫向擴(kuò)展”模式,事實上,“***”意味著這種結(jié)構(gòu)與當(dāng)前的公有云相同;即,對于特定的應(yīng)用集合,結(jié)構(gòu)可以***按需擴(kuò)展,而不用擔(dān)心性能下降或增加延遲的風(fēng)險。
存儲能夠自動應(yīng)對處理多項不同性能需求的工作負(fù)載而無需人工介入調(diào)整。使用在應(yīng)用主站點的超融合架構(gòu)原理在此同樣適用。
軟件定義是這類存儲的核心,其使得控制層與數(shù)據(jù)層分離,從而令系統(tǒng)可以使用市場上絕大多數(shù)現(xiàn)有的硬件,擺脫被硬件鎖定的風(fēng)險;同樣,其既可以在本地,亦可以運行于云端。
存儲與公共云或私有云緊密集成。除了將數(shù)據(jù)發(fā)送到云端外,這還意味著能夠在云端完成數(shù)據(jù)的管理與保護(hù)。其必須能夠無縫得將云作為一個存儲層。
存儲可以應(yīng)對處理當(dāng)前或未來可能出現(xiàn)的所有二級站點的工作負(fù)載。在今天,這或許意味著數(shù)據(jù)保護(hù)、存檔、災(zāi)難恢復(fù)、復(fù)制、數(shù)據(jù)遷移、重復(fù)數(shù)據(jù)刪除、壓縮加密、測試/開發(fā)以及復(fù)制數(shù)據(jù)管理(CDM)和分析。
存儲至少能夠支持多種混合的數(shù)據(jù)塊、文件與對象協(xié)議,其中包括iSCSI、光纖通道、NFS、SMB和REST,并且能夠在同一個存儲池中儲存所有的文件和對象。
存儲完全基于策略。首先設(shè)置工作負(fù)載的策略,可能使用預(yù)定義的模板,然后系統(tǒng)管理整個數(shù)據(jù)生命周期和工作流程,包括啟動和拆卸基礎(chǔ)架構(gòu)資源,而無需操作員參與介入。
存儲具備的服務(wù)質(zhì)量(QoS)控制。根據(jù)定義,許多二級應(yīng)用程序要運行在基礎(chǔ)架構(gòu),因此系統(tǒng)必須能夠根據(jù)預(yù)設(shè)的策略自動分配資源,并且有適合的方案來確保其合規(guī)性。
存儲可以和主站點的存儲資源那樣同時支持物理與虛擬的工作負(fù)載。
存儲可以索引元數(shù)據(jù)與內(nèi)容,具備構(gòu)建定制化分析的能力,能夠支持復(fù)雜的搜索功能,包括在文件中搜索數(shù)據(jù)的能力。檢索的結(jié)果通過標(biāo)準(zhǔn)的API反饋給應(yīng)用程序。
存儲可以通過一個基于Web頁面的管理控制平臺,經(jīng)由任意可以接入互聯(lián)網(wǎng)的位置管理到整個二級基礎(chǔ)架構(gòu)——并根據(jù)客戶需要設(shè)定全局命名空間。其能夠和常見管理平臺(例如VMware的vRealize Automation)相集成。
存儲體系結(jié)構(gòu)具備自我修復(fù)的能力,在發(fā)生故障時不需立即更換故障部件;可以應(yīng)對多塊磁盤與節(jié)電的故障;不會喪失靈活性與可用性;毋須進(jìn)行數(shù)據(jù)遷移;且IT可以實時調(diào)整系統(tǒng)的彈性。
存儲可以內(nèi)設(shè)數(shù)據(jù)虛擬化策略,從而確保某個數(shù)據(jù)副本可用于多項應(yīng)用程序的工作負(fù)載。
存儲具備企業(yè)級安全性,包括后端的靜態(tài)數(shù)據(jù)加密,以及活動數(shù)據(jù)的存取訪問控制。同樣,存儲可選第三方的密鑰管理器。
存儲提供以秒和分鐘測量的恢復(fù)點目標(biāo),具有瞬時恢復(fù)時間目標(biāo)(不需要進(jìn)行數(shù)據(jù)回算和重構(gòu))。
行業(yè)中存在著一種普遍的誤解,即Hypervisor是實現(xiàn)超融合技術(shù)的先決條件。由于超融合技術(shù)首先使用在主站點并適用于虛擬工作負(fù)載,于是看似使用一項Hypervisor虛擬機(jī)管理程序必不可少。 但隨著行業(yè)向容器(container)技術(shù)轉(zhuǎn)移,這種先決條件將逐漸消失。 在二級站點上的情形同樣如此。
正如你所看到的,上述這些將成為一項廣泛的需求。 我相信當(dāng)前我們正處于這樣一個時刻,即所有適合的技術(shù)都可以實現(xiàn)這種愿景。 目前市場上的數(shù)款產(chǎn)品已經(jīng)非常接近,而其他供應(yīng)商在接下來的18個月內(nèi)爭相達(dá)成類似的目標(biāo),而另一方面,由于當(dāng)前的架構(gòu)設(shè)計,有些供應(yīng)商或許永遠(yuǎn)無法做到。
超融合,準(zhǔn)備好了么?
假如脫離一定的評估標(biāo)準(zhǔn),想必會有不少的供應(yīng)商聲稱他們的產(chǎn)品能夠滿足上述條件,但事實并非如此。那么,讓我們來仔細(xì)看看市場上這些不同類別的超融合二級存儲產(chǎn)品,以此了解更多。
在計算機(jī)科學(xué)領(lǐng)域,一項毋庸置疑的事實是:你的體系結(jié)構(gòu)在設(shè)定以后,便決定了未來可以達(dá)成,或難以(有效)實現(xiàn)的目標(biāo)。因此,對于大多數(shù)在幾十年前便從事數(shù)據(jù)保護(hù)與數(shù)據(jù)復(fù)制產(chǎn)品的供應(yīng)商而言,他們很難支持橫向擴(kuò)展的節(jié)點結(jié)構(gòu)、虛擬化以及在過去五年出現(xiàn)的許多其它技術(shù)。
例如,假如某家供應(yīng)商是CDM領(lǐng)域的專家,那么很可能他們要求受管理的數(shù)據(jù)副本必須要遷移到特定的數(shù)據(jù)庫中。數(shù)據(jù)保護(hù)則可能是(也可能不是)該產(chǎn)品的組成部分(換句話說,可能需要第三方數(shù)據(jù)保護(hù)應(yīng)用支持),產(chǎn)品可能(也很可能)不支持橫向擴(kuò)展。
各家供應(yīng)商所提供的分析技術(shù)水平層次不齊,其中大多數(shù)仍側(cè)重于存儲利用率與數(shù)據(jù)保護(hù)指標(biāo)。當(dāng)由某家供應(yīng)商單獨提供歸檔技術(shù)時,其很可能會形成信息孤島。云集成或許只是單純實現(xiàn)了數(shù)據(jù)傳輸功能。大多數(shù)重復(fù)數(shù)據(jù)刪除產(chǎn)品只是:用于減少數(shù)據(jù)副本的專屬設(shè)備。它們與同一(或不同)供應(yīng)商提供的數(shù)據(jù)保護(hù)產(chǎn)品協(xié)同工作。橫向擴(kuò)展只適用于有限的一些供應(yīng)商產(chǎn)品,遠(yuǎn)非市場上所有的方案。
與此同時,某些復(fù)制產(chǎn)品只能執(zhí)行特定的功能,從而又造成某項單一功能的封閉性。大多數(shù)產(chǎn)品缺乏真正的QoS功能。雖然可能存在服務(wù)級別協(xié)議和基于策略的控制平臺,但通常無法確定其合規(guī)性。經(jīng)過設(shè)計,對象存儲提供商可以具備橫向擴(kuò)展、單一命名空間、完全可靠安全的平臺(借助糾刪碼),但往往會缺乏完整的文件支持,并且難以支持上述所有二級站點的工作負(fù)載。
經(jīng)由過去三十年的不斷發(fā)展,今天支持二級站點的產(chǎn)品系列遍布各個領(lǐng)域。其中的絕大多數(shù)只是被設(shè)計完成單一的使命,從這點上講這些產(chǎn)品做得不錯。但是世界正在發(fā)生改變,單靠數(shù)據(jù)保護(hù)是遠(yuǎn)遠(yuǎn)不夠的。我們必須重新思考和定義海量信息、消費數(shù)據(jù)、合規(guī)性、社交媒體、移動應(yīng)用、云計算和大數(shù)據(jù)分析領(lǐng)域的保護(hù)與可用性的整理范例。
雖然從本質(zhì)上去轉(zhuǎn)變二十年前架構(gòu)的產(chǎn)品很困難,但供應(yīng)商們卻在努力嘗試,有時經(jīng)由自己的開發(fā)團(tuán)隊,更多的則是借助合作伙伴。他們?nèi)绾芜_(dá)成目標(biāo),或者如何達(dá)成目標(biāo),我們拭目以待。
今天有兩家企業(yè),他們的視角與本專欄所定義的最為接近。Cohesity滿足了上述大多數(shù)的標(biāo)準(zhǔn);Rubrik也較為接近,只是缺失了些許關(guān)鍵部分。 CDM領(lǐng)域的供應(yīng)商,例如Actifio和Catalogic也有許多產(chǎn)品,很可能會彌補這些空缺。 IBM Spectrum Copy Data Management利用Spectrum Protect,并且(最有可能)將其與IBM Cloud Object Storage緊密集成,從而提供橫向擴(kuò)展功能。同時我們也不應(yīng)該忘記,SimpliVity(最近被HPE所收購)以及Scale Computing曾公開展示在單個基礎(chǔ)架構(gòu)中為主存儲和二級存儲應(yīng)用實現(xiàn)超融合的愿景。
在諸如亞馬遜網(wǎng)絡(luò)服務(wù)(Amazon Web Services)等公有云服務(wù)商的領(lǐng)導(dǎo)下,主數(shù)據(jù)存儲端的改造業(yè)已在過去十年推動了整個行業(yè)的發(fā)展。我認(rèn)為超融合技術(shù)直接來自于將公有云的理念應(yīng)用于企業(yè)自行部署的基礎(chǔ)設(shè)施。同時我還相信超融合技術(shù)會運用于數(shù)據(jù)中心內(nèi)具有相同重要性的二級存儲。在這方面的需求量甚至?xí)?,畢竟存儲于二級存儲中的?shù)據(jù)占到了整體數(shù)據(jù)量的80%。
我們可以使得二級存儲大放光彩,利用它實現(xiàn)更好的業(yè)務(wù)決策;同樣,它也可能變成龐大而臃腫的數(shù)據(jù)堆棧。昨天的體系架構(gòu)很難幫助我們帶到前者。二級站點需要和主站點一樣基于超融合技術(shù)。