成功數(shù)據(jù)集成策略中的八項關(guān)鍵性元素
譯文【51CTO.com快譯】 對來自多種來源的數(shù)據(jù)進行集成一直是個令I(lǐng)T人士頭痛的復(fù)雜問題,而如今日益龐大的數(shù)據(jù)體積與多種多樣的數(shù)據(jù)類型令其更加難以處理。在今天的文章中,我們將探討實現(xiàn)數(shù)據(jù)集成策略成功的八項關(guān)鍵性元素。
***拍檔:數(shù)據(jù)集成與應(yīng)用集成
數(shù)據(jù)集成與應(yīng)用集成在傳統(tǒng)角度上彼此并無關(guān)聯(lián),但如今這一狀況正發(fā)生變化。根據(jù)Forrester公司企業(yè)架構(gòu)***分析師Brian Hopkins所言,部分開創(chuàng)性廠商已經(jīng)開始將數(shù)據(jù)集成至某些業(yè)務(wù)流程當中。“大數(shù)據(jù)處理與內(nèi)存成本的持續(xù)走低使得我們能夠以原始或者近乎原始格式實現(xiàn)數(shù)據(jù)存儲,并立足于內(nèi)存之內(nèi)進行復(fù)雜的集成操作,”Hopkins在其最近發(fā)布的數(shù)據(jù)集成報告中寫道。這種新型架構(gòu)將能夠更為順暢地實現(xiàn)數(shù)據(jù)集成。
應(yīng)用對數(shù)據(jù):哪一方更加權(quán)威?
Gartner公司副總裁兼著名分析師Mark Beyer也認為,數(shù)據(jù)集成與應(yīng)用集成已經(jīng)被緊密聯(lián)系在一起。而在相關(guān)工作當中,企業(yè)需要決定哪一方的權(quán)威性更高。“二者都在嘗試對數(shù)據(jù)進行管理,”他在采訪當中表示。“因此必須由決策者判斷二者哪者擁有數(shù)據(jù)的權(quán)威操作能力。”
將數(shù)據(jù)移動技術(shù)視為中間件
有些人認為應(yīng)當盡可能避免將數(shù)據(jù)從一套系統(tǒng)遷移至另一套系統(tǒng)。但是隨著大數(shù)據(jù)技術(shù)的出現(xiàn),數(shù)據(jù)移動已經(jīng)變得不可避免。他認為,數(shù)據(jù)移動相關(guān)技術(shù)“應(yīng)作為中間件從全部數(shù)據(jù)源及數(shù)據(jù)存儲中解耦出來。”這套方案能夠顯著簡化并加快升級速度。
投資建立現(xiàn)代架構(gòu)
Forrester公司的Brian Hopkins在采訪中表示,企業(yè)需要一套現(xiàn)代架構(gòu)以實施成功的數(shù)據(jù)集成策略。以往的實踐及架構(gòu)需要將ETL包含于數(shù)據(jù)倉庫之內(nèi),并將數(shù)據(jù)存儲于數(shù)據(jù)湖當中。“如今一大重要變化在于,開源大數(shù)據(jù)工具開始被廣泛用于立足來源進行大規(guī)模數(shù)據(jù)的快速管理……實現(xiàn)數(shù)據(jù)流正是實現(xiàn)成功數(shù)據(jù)集成策略的重要組成部分。”
關(guān)注安全性
在大數(shù)據(jù)集成領(lǐng)域,安全性仍是一項非常重要的保障因素。Forrester公司的Hopkins表示,安全性絕對是Hadoop領(lǐng)域的核心問題,因為Hadoop發(fā)布方Cloudera與Hortonworks在其大數(shù)據(jù)應(yīng)用安全性方面走出了各自不同的道路。“這種作法并不適合每類用戶,”他指出。這意味著企業(yè)需要高度關(guān)注自身所使用各類工具的具體安全性問題。
放開管制
Gartner公司的Beyer指出,如今IT人士的一大難題在于其需要負責(zé)數(shù)據(jù)基礎(chǔ)設(shè)施與數(shù)據(jù)管理任務(wù),但同時又不再具備完整的控制能力。“數(shù)據(jù)管理模式將變得五花八門——包括分布式、云端、內(nèi)部乃至應(yīng)用當中。要實現(xiàn)數(shù)據(jù)集成,首先需要將治理模式從管理方案中獨立出來。治理是需要執(zhí)行的任務(wù),而管理是達成目標的途徑。”
重新審視元數(shù)據(jù)
根據(jù)Beyer的觀點,元數(shù)據(jù)如今正得到重新審視,但具體角度則與傳統(tǒng)的靜態(tài)數(shù)據(jù)源與值信息有所區(qū)別。新的元數(shù)據(jù)關(guān)注方向包括數(shù)據(jù)的訪問與使用頻率,這類信息能夠幫助我們了解數(shù)據(jù)的重要程度。數(shù)據(jù)是否被用于進行多種不同類型的分析?其屬于監(jiān)管型、事務(wù)型或者操作型?通過這些指標,大家將能夠找到真正需要加以良好治理的關(guān)鍵性數(shù)據(jù)。
關(guān)注內(nèi)容形式與內(nèi)容偏差
Beyer指出,他認為在未來三到五年當中,企業(yè)將意識到數(shù)據(jù)集成與數(shù)據(jù)分析中存在著固有偏見。“簡單來講,所有數(shù)據(jù)都包含有創(chuàng)造者的偏見,”他在一篇博文當中指出。“所有數(shù)據(jù)都可從多個角度加以審視,而每個數(shù)據(jù)點都反映出業(yè)務(wù)流程設(shè)計者的自身意圖,意味著我們不可能真正利用現(xiàn)有數(shù)據(jù)集成機制進行純粹的客觀分析。”Beyer就此給出的解決方案在于鼓勵真正的數(shù)據(jù)科學(xué)家構(gòu)建可用于解釋數(shù)據(jù)真實含義的數(shù)據(jù)競爭性機制。其將至少通過兩條軸對數(shù)據(jù)內(nèi)容進行理論比較。
原文鏈接:
http://www.informationweek.com/big-data/big-data-analytics/8-critical-elements-of-a-successful-data-integration-strategy/d/d-id/1327107?image_number=9
【51CTO譯稿,合作站點轉(zhuǎn)載請注明原文譯者和出處為51CTO.com】