自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

BI和真實數(shù)據(jù)分析降低云存儲成本

云計算
公共云應(yīng)用的最大瓶頸似乎是高昂的云計算存儲成本。與Web相關(guān)的云應(yīng)用可能會存儲數(shù)以百兆的數(shù)據(jù),而關(guān)鍵任務(wù)應(yīng)用則可能會存儲TB級的數(shù)據(jù),按目前的價格來看,其存儲成本是大部分用戶所難以承受的。但是值得慶幸的是,我們有兩種策略可以來解決這一云存儲成本問題:數(shù)據(jù)抽象和分布查詢式數(shù)據(jù)訪問。

對于圍繞云計算的所有應(yīng)用來說,目前公共云服務(wù)中的應(yīng)用只代表了IT總支出的一小部分。除非主流的、占企業(yè)預(yù)算大頭的關(guān)鍵任務(wù)應(yīng)用能夠遷往公共云,否則這一態(tài)勢將不會發(fā)生變化。

公共云應(yīng)用的***瓶頸似乎是高昂的云計算存儲成本。與Web相關(guān)的云應(yīng)用可能會存儲數(shù)以百兆的數(shù)據(jù),而關(guān)鍵任務(wù)應(yīng)用則可能會存儲TB級的數(shù)據(jù),按目前的價格來看,其存儲成本是大部分用戶所難以承受的。但是值得慶幸的是,我們有兩種策略可以來解決這一云存儲成本問題:數(shù)據(jù)抽象和分布查詢式數(shù)據(jù)訪問。

將數(shù)據(jù)抽象方法用于商業(yè)智能和成本分析應(yīng)用

商業(yè)智能(BI)與分析是云計算最有前途的兩個應(yīng)用。這些應(yīng)用都聚集在重要IT決策上,且遍布在規(guī)劃者和決策者中。這使得它們成為理想的云計算應(yīng)用,但是通常企業(yè)估計一個試運行商業(yè)智能應(yīng)用的運行成本至少為三萬美元,這個價格相當(dāng)昂貴。

建立真實而不過分龐大的大數(shù)據(jù)是我們之前提出的兩個數(shù)據(jù)成本管理方法中***個,即數(shù)據(jù)抽象的一個具體實施。數(shù)據(jù)抽象是從原始公司信息中產(chǎn)生一個或多個摘要數(shù)據(jù)庫的機制,其數(shù)據(jù)庫規(guī)模應(yīng)確保它(們)能夠被經(jīng)濟地存儲在云計算中。

 

[[72770]]

 

BI和真實數(shù)據(jù)分析降低云存儲成本

我們在醫(yī)療行業(yè)中的某一個客戶說,通過診斷代碼、治療代碼以及年齡/性別的形式,創(chuàng)建一組患者信息摘要數(shù)據(jù)庫,將減少三百倍以上的信息量,這意味著其云數(shù)據(jù)存儲和訪問成本僅為未經(jīng)數(shù)據(jù)抽象處理的三百分之一。

如果希望數(shù)據(jù)抽象方法成為一種高效的成本管理方法,那么就必須對如何進行分析以及分析的對象進行深入研究。大多數(shù)BI運行的目的并不是為了發(fā)現(xiàn)細節(jié)信息;它們是為了尋找某種規(guī)律或某種發(fā)展趨勢。對于大多數(shù)的行業(yè)來說,有明確的變量非常重要,例如醫(yī)療行業(yè)中的診斷和治療就是這樣。通過對這些變量創(chuàng)建摘要數(shù)據(jù)庫,能夠通過加快訪問速度來降低成本支出,同時也不會影響分析工作本身。一旦定義好變量的特定組合,那么之后如有需要從未抽象的數(shù)據(jù)中提取該組合的詳細信息也是非常容易實現(xiàn)。這樣一來,基于數(shù)據(jù)抽象的分析就成為了一個云應(yīng)用,可以用于數(shù)據(jù)中心的詳細分析操作。

對非結(jié)構(gòu)化數(shù)據(jù)使用分布查詢式訪問方法

數(shù)據(jù)抽象方法適用于對具有少量重要變量參數(shù)結(jié)構(gòu)化交易數(shù)據(jù)的分析應(yīng)用。但它不適用于非結(jié)構(gòu)化格式的傳統(tǒng)大數(shù)據(jù),這是因為非結(jié)構(gòu)化數(shù)據(jù)的抽象比較難以實現(xiàn)。有些公司在創(chuàng)建電子郵件特定單詞或單詞組合高識別率數(shù)據(jù)庫的應(yīng)用中有過不少成功案例,但是其前提條件是這樣的關(guān)鍵詞/詞組合是可以預(yù)先知道的。對于大多數(shù)應(yīng)用來說,還是需要有一個更為通用的方法的。這個方法就是我們所提出的第二個數(shù)據(jù)成本管理策略——分布查詢式數(shù)據(jù)訪問方法。

通常來說,數(shù)據(jù)處理任務(wù)可以分為三個部分:對數(shù)據(jù)的實際處理、用于定位數(shù)據(jù)位置的數(shù)據(jù)庫管理訪問,以及從海量存儲設(shè)備中獲取信息的存儲訪問。如果由于成本原因而無法把大量的信息遷往云,那么也就無法在云中實現(xiàn)信息的逐條訪問。***的解決方法就是在云以外的某地托管數(shù)據(jù)和查詢邏輯,并發(fā)送數(shù)據(jù)庫管理系統(tǒng)(DBMS)查詢命令以提取數(shù)據(jù)的一個子集,從而實現(xiàn)在云中的數(shù)據(jù)處理。在企業(yè)內(nèi)部確保DBMS引擎功能并只把查詢和結(jié)果遷入/出云能夠顯著地降低數(shù)據(jù)存儲和訪問成本。

針對這類功能劃分對應(yīng)用程序進行結(jié)構(gòu)設(shè)計是相對簡單的,事實上,正有越來越多的廠商提供了包含存儲/查詢功能的DBMS引擎或設(shè)備。但是,構(gòu)建針對應(yīng)用程序的檢查以防止有問題的查詢結(jié)構(gòu)提供所有的數(shù)據(jù)信息是非常必要的措施。在這里,試點測試是不夠的;在交付前,查詢邏輯應(yīng)當(dāng)測試結(jié)果的大小。

認(rèn)識到分布式查詢處理的問題

大數(shù)據(jù)的一個特殊狀況是,有可能出現(xiàn)信息不是存儲在一個地方的情況。電子郵件、即時通信以及協(xié)作信息通常都被保存在它產(chǎn)生的地方,因此企業(yè)可能會擁有數(shù)十個或數(shù)百個網(wǎng)站。這就產(chǎn)生了分布式查詢處理的問題,它通常被稱為MapReduce的解決方案架構(gòu)或最常用的開源實施Hadoop。

但結(jié)構(gòu)化數(shù)據(jù)能夠解決分布式查詢;一家金融公司報告說,它的客戶借用了從位于主要大城市區(qū)域三十多個數(shù)據(jù)庫抽取數(shù)據(jù)而得到的經(jīng)驗分析結(jié)果。對于結(jié)構(gòu)化的DBMS分析,即便查詢命令被發(fā)送至每個站點以便于單獨運行,也可使用SQL/DBMS命令來“綜合”來自于多個站點的結(jié)果。這樣一來,問題就轉(zhuǎn)變成為要確保在每個地方查詢命令都要被細分以便于完全運行;否則,運行每個命令就都要求訪問其它地方的數(shù)據(jù),其成本就會變得相當(dāng)高。

雖然很多人都在關(guān)注如何創(chuàng)建混合云,但是對于未來云中關(guān)鍵任務(wù)應(yīng)用程序來說,創(chuàng)建“混合數(shù)據(jù)”將是更為重要的任務(wù)。如果缺少一種***化使用物美價廉本地存儲資源和高度靈活云計算處理的方法,那么用戶們可能會發(fā)現(xiàn)他們的大型數(shù)據(jù)將迫使他們保持傳統(tǒng)的IT架構(gòu)。這不僅會讓云失去與關(guān)鍵任務(wù)應(yīng)用程序相關(guān)的收入,而且也讓云計算失去了對企業(yè)的吸引力。

責(zé)任編輯:王程程 來源: TechTarget中國
相關(guān)推薦

2020-06-17 07:00:00

云計算數(shù)據(jù)存儲

2010-05-14 09:02:03

云計算成本

2020-06-03 07:00:12

云成本監(jiān)控工具云散亂

2022-05-23 14:55:40

云計算工具成本

2012-05-30 11:29:14

Hadoop大數(shù)據(jù)

2017-10-25 08:19:21

云存儲云鎖定風(fēng)險

2022-05-07 19:02:19

云成本云計算

2022-04-01 08:02:44

云成本服務(wù)器互聯(lián)網(wǎng)

2020-09-02 11:22:40

數(shù)字聯(lián)盟

2020-06-09 11:16:42

云計算云平臺工具

2022-02-18 13:46:05

云計算混合云技巧

2013-05-29 09:50:55

IBM大數(shù)據(jù)分析大數(shù)據(jù)

2018-09-27 14:37:09

風(fēng)險云計算安全

2018-05-09 10:59:55

軟件定義存儲

2023-06-08 18:59:49

2022-11-10 14:27:24

降低云成本云計算

2021-03-15 10:43:20

大數(shù)據(jù)數(shù)據(jù)分析工具

2018-09-12 15:21:05

云宕機云計算數(shù)據(jù)中心

2015-10-30 14:56:40

真實數(shù)據(jù)欺騙
點贊
收藏

51CTO技術(shù)棧公眾號