基礎(chǔ)架構(gòu)受阻 大數(shù)據(jù)何談大價(jià)值
在關(guān)于大數(shù)據(jù)的交流對(duì)話中,缺少對(duì)支持其運(yùn)行的必要基礎(chǔ)設(shè)施的關(guān)注—特別是實(shí)時(shí)應(yīng)用方面。
對(duì)于很多企業(yè)來說,大數(shù)據(jù)意味著有權(quán)使用它們一直用的數(shù)據(jù)倉庫。數(shù)據(jù)倉庫已經(jīng)并將繼續(xù)作為企業(yè)級(jí)組織的關(guān)鍵組成部分。
這樣的系統(tǒng)通過組織提供數(shù)據(jù)集合并且可以將數(shù)據(jù)分解并打包,使業(yè)務(wù)分析師能夠?qū)I(yè)務(wù)狀況進(jìn)行深入分析。
正是這種數(shù)據(jù)形式(經(jīng)分析處理轉(zhuǎn)化為可操作的信息),將被集成到數(shù)據(jù)中心,用于應(yīng)用程序和基礎(chǔ)設(shè)施,作為輸入信息進(jìn)入無數(shù)的系統(tǒng)和程序來進(jìn)行近實(shí)時(shí)決策。
但是,數(shù)據(jù)倉庫的設(shè)計(jì)并不是為了這些形式的大量的集成和訪問量,也不是為了各種各樣的協(xié)助處理數(shù)據(jù)的商業(yè)智能系統(tǒng)。
有時(shí)候大量的輸入數(shù)據(jù)會(huì)使支持系統(tǒng)崩潰,加上那些大量的試圖訪問精確數(shù)據(jù)的系統(tǒng),這樣的應(yīng)用程序不大可能支撐住如此大的壓力。
如果企業(yè)中的大數(shù)據(jù)成為用來發(fā)展業(yè)務(wù)和操作的成功平臺(tái),那么必須將它視為一個(gè)更重要的數(shù)據(jù)中心資產(chǎn)。這一途徑需要長時(shí)間艱苦的努力進(jìn)行基礎(chǔ)設(shè)施和體系結(jié)構(gòu)的建設(shè),以保證對(duì)該系統(tǒng)的訪問并且可以擴(kuò)展以滿足更多需要。
與用在面向公眾的應(yīng)用程序一樣的體系結(jié)構(gòu),我們幾乎肯定會(huì)用于實(shí)現(xiàn)模型中,該模型中大數(shù)據(jù)可以像傳統(tǒng)使用一樣(每天甚至每周)以及接近實(shí)時(shí)。這是我們期待的下一代數(shù)據(jù)中心模型的發(fā)展方向,也是最有價(jià)值的地方。
數(shù)據(jù)檢索堵塞
可靠性是最重要的,尤其是涉及基礎(chǔ)設(shè)施的地方。基礎(chǔ)設(shè)施和應(yīng)用服務(wù)的整合經(jīng)常會(huì)出現(xiàn)障礙,這會(huì)導(dǎo)致系統(tǒng)在實(shí)時(shí)檢索數(shù)據(jù)時(shí)需要進(jìn)行等待。它就是不能連續(xù)處理,直到該進(jìn)程完成或者以其他方式成功。
當(dāng)服務(wù)運(yùn)行良好的時(shí)候,堵塞不再是什么問題。數(shù)據(jù)幾乎可以立即重新獲取,并繼續(xù)進(jìn)行處理。但是當(dāng)服務(wù)不堪重負(fù)時(shí),對(duì)此依賴的系統(tǒng)將陷入等待響應(yīng)。
這種延遲會(huì)影響數(shù)據(jù)供應(yīng)鏈,從服務(wù)本身到相依系統(tǒng)以及最終的用戶,這些用戶不明白為什么系統(tǒng)會(huì)反應(yīng)遲鈍,因?yàn)樗钌铍[藏在幾個(gè)體系架構(gòu)層下,還沒有辦法通過系統(tǒng)及時(shí)通知他們。
因此,大數(shù)據(jù)系統(tǒng)的可靠性和性能是必須保證的。一個(gè)適當(dāng)?shù)脑O(shè)計(jì)架構(gòu),要聚焦可擴(kuò)展性和內(nèi)部關(guān)聯(lián)性,這是大數(shù)據(jù)驅(qū)動(dòng)組織的特點(diǎn)。
今天所關(guān)注的投入體系結(jié)構(gòu)的建設(shè)以實(shí)現(xiàn)可擴(kuò)展性的路肯定需要很長的時(shí)間,才能使整個(gè)數(shù)據(jù)中心能夠廣泛的使用大數(shù)據(jù)。