大數(shù)據(jù)技術(shù)是如何發(fā)展的?
事實(shí)表明,大數(shù)據(jù)的挑戰(zhàn)仍然集中在在正確的時間將正確的信息提供給正確的人,即使信息來源和使用在增長。
2013年,行業(yè)專家宣布開始進(jìn)入大數(shù)據(jù)時代。他們認(rèn)為,大數(shù)據(jù)使組織能夠以正確的速度和正確的時間存儲、管理和操作大量數(shù)據(jù),以獲得正確的見解。
大數(shù)據(jù)并不代表一種單一的技術(shù),而是一組不同的數(shù)據(jù)管理技術(shù),其根源是之前的幾次技術(shù)變革。
現(xiàn)在的問題是:大數(shù)據(jù)現(xiàn)在在哪里?成熟它的應(yīng)用需要什么?
公平地說,最近的分析師調(diào)查發(fā)現(xiàn),大數(shù)據(jù)還沒有帶來重大的商業(yè)成果。盡管有這么多的宣傳,但大多數(shù)企業(yè)員工仍然無法方便地獲得完成工作所需的信息。隨著信息源、使用和用戶數(shù)量的增長,問題仍然集中在在正確的時間將正確的信息提供給正確的人。
數(shù)據(jù)倉庫vs.數(shù)據(jù)湖vs.數(shù)據(jù)結(jié)構(gòu)
為了容納所有這些數(shù)據(jù),存儲和管理系統(tǒng)如雨后春筍般涌現(xiàn),比如數(shù)據(jù)倉庫、數(shù)據(jù)湖和數(shù)據(jù)結(jié)構(gòu)。但是,在解決方案和平臺級別上,需要一個數(shù)據(jù)結(jié)構(gòu)作為跨企業(yè)的所有數(shù)據(jù)集成、管理和治理的保護(hù)傘。企業(yè)間的凝聚力是必須的。
行業(yè)專家指出,集中數(shù)據(jù)通常是不可行的。或者使用服務(wù)對分析進(jìn)行原型化,以訪問不同的數(shù)據(jù)源,然后如果它被證明是富有成效的,并且業(yè)務(wù)需要指示它。中心化在后面完成。
Hurwitz公司分析師DanKirsch指出數(shù)據(jù)去中心化趨勢和數(shù)據(jù)結(jié)構(gòu)之間的聯(lián)系。他說,“我們已經(jīng)看到數(shù)據(jù)結(jié)構(gòu)方法越來越受歡迎,因?yàn)閾碛幸粋€中央存儲庫來保存所有的數(shù)據(jù)是不現(xiàn)實(shí)的?!币虼?,數(shù)據(jù)結(jié)構(gòu)需要允許異構(gòu)數(shù)據(jù)位置。數(shù)據(jù)結(jié)構(gòu)方法有助于解決分擔(dān)責(zé)任的挑戰(zhàn),也就是每個團(tuán)隊(duì)負(fù)責(zé)自己的數(shù)據(jù),然后將其連接起來,而不是將數(shù)據(jù)轉(zhuǎn)儲到數(shù)據(jù)湖中。AWS公司認(rèn)為,數(shù)據(jù)湖是分析成功的唯一途徑。當(dāng)然,他們希望企業(yè)將所有數(shù)據(jù)都轉(zhuǎn)儲到AWS云平臺上。
Gartner公司數(shù)據(jù)與分析副總裁NickHeudecker對此表示贊同,并認(rèn)為所有這些趨勢都很重要。他指出,“每個概念服務(wù)于不同的用戶和用例,高性能、可重復(fù)分析的數(shù)據(jù)倉庫。用于問題開發(fā)/實(shí)驗(yàn)的數(shù)據(jù)湖。數(shù)據(jù)網(wǎng)格用于使用帶有治理監(jiān)督的分布式數(shù)據(jù)。因此,沒有混淆?!?/p>
將大數(shù)據(jù)戰(zhàn)略集中在一個平臺上
專家們利用雙重策略,但堅(jiān)持單一平臺。通常有兩種策略。一種策略是針對產(chǎn)品,另一種是針對分析。每個都有自己的核心樞紐平臺,并支持多個數(shù)據(jù)存儲庫。然后在兩個核心樞紐之間有一個ETL平臺。
但是,是哪個供應(yīng)商提供了這些服務(wù)的大部分呢?還沒有看到任何一款認(rèn)為能夠獨(dú)立成為完整平臺的游戲。
多個數(shù)據(jù)存儲庫在很多方面,它不是集中數(shù)據(jù),而是集成數(shù)據(jù)。而如何將所有數(shù)據(jù)集成起來,使其可視化,并將其連接到其他系統(tǒng)。
集中所有數(shù)據(jù)會帶來成本、管理和安全問題。數(shù)據(jù)被鎖定在業(yè)務(wù)線應(yīng)用程序中,在辦公場所和云生態(tài)系統(tǒng)中。連接數(shù)據(jù)所在位置有助于消除風(fēng)險,提高洞察速度。這并不是一個單一的供應(yīng)商解決方案故事。一些企業(yè)提供查詢功能,但治理故事還沒有被任何人充實(shí)起來。大數(shù)據(jù)中使得移動數(shù)據(jù)成為一個挑戰(zhàn)。多平臺是常態(tài)。如果幸運(yùn)的話,可以將工具和技能標(biāo)準(zhǔn)化。
因此,數(shù)據(jù)結(jié)構(gòu)是一種數(shù)據(jù)管理概念,用于實(shí)現(xiàn)靈活的、可重用的和增強(qiáng)的數(shù)據(jù)集成管道、服務(wù)和語義,以支持跨多個部署和編排平臺交付的各種操作和分析用例。
確保遵守數(shù)據(jù)治理和數(shù)據(jù)隱私規(guī)則
因此,數(shù)據(jù)結(jié)構(gòu)是一種數(shù)據(jù)管理概念,用于實(shí)現(xiàn)靈活的、可重用的和增強(qiáng)的數(shù)據(jù)集成管道、服務(wù)和語義,以支持跨多個部署和編排平臺交付的各種操作和分析用例。
確保遵守數(shù)據(jù)治理和數(shù)據(jù)隱私規(guī)則
為了有效地管理數(shù)據(jù),企業(yè)必須清楚地了解自己擁有哪些數(shù)據(jù)。組織需要了解他們的數(shù)據(jù)湖或數(shù)據(jù)結(jié)構(gòu)中有哪些類型的數(shù)據(jù)。如果個人身份信息(PII)參與了一個特定的應(yīng)用程序或新的努力,企業(yè)需要指派一名高管監(jiān)督個人數(shù)據(jù)的適當(dāng)使用。高管還可以幫助解決數(shù)據(jù)的可行性和適用性的問題。
管理人員扮演著至關(guān)重要的治理角色。因此,定義“管理員”很重要,他們的全部工作就是在信息的最初來源處訪問和管理對信息的更正。他們從業(yè)務(wù)團(tuán)隊(duì)中輪換出來,制定KPI。
重要的是預(yù)先定義管理員,并知道如何在過程中與他們簽入。獲得管理員對用戶體驗(yàn)設(shè)計(jì)的反饋也很重要。
云計(jì)算技術(shù)對大數(shù)據(jù)戰(zhàn)略的影響?
云計(jì)算正在成為計(jì)算和存儲的另一種形式,而不是一個獨(dú)立的環(huán)境。云管理和可見性很重要。假設(shè)云計(jì)算是一種快速消耗預(yù)算的方法。在很多情況下,沒有理由將一些應(yīng)用程序移到云端。能夠在云上立即對概念和實(shí)驗(yàn)進(jìn)行證明是非常重要的。
云計(jì)算允許組織嘗試新事物,并根據(jù)需要增加或刪除計(jì)算能力,而不必等待物理工作完成。
數(shù)據(jù)過程在哪里成熟?
流程需要明確定義術(shù)語的基礎(chǔ)。從事務(wù)系統(tǒng)開始是至關(guān)重要的。如果數(shù)據(jù)一開始是錯誤的,就需要花費(fèi)大量時間來清理和增強(qiáng)該數(shù)據(jù)。
在促進(jìn)圍繞數(shù)據(jù)共享場景的領(lǐng)域需要大部分成熟度,比如數(shù)據(jù)讀寫能力。數(shù)據(jù)操作可以幫助提高彈性,但它仍然是一種壓倒性的技術(shù)實(shí)踐。
結(jié)語
顯然,大數(shù)據(jù)正處于分析師所說的“幻滅低谷”。盡管數(shù)據(jù)驅(qū)動型公司將是長期贏家,但仍有工作要做。
獲勝者需要進(jìn)行數(shù)據(jù)治理,以使數(shù)據(jù)足夠用于任務(wù)和保護(hù)。他們還需要改進(jìn)數(shù)據(jù)處理過程。數(shù)據(jù)操作和數(shù)據(jù)治理可以一起提供幫助。