Gartner預(yù)測:90%的數(shù)據(jù)湖將毫無用處
Gartner此前曾預(yù)計,到2018年,90%的數(shù)據(jù)湖將毫無用處,因為它們充滿了原始數(shù)據(jù),很少有人會使用這些技術(shù)。
在當前的技術(shù)領(lǐng)域,沒有什么能像人工智能(AI)那樣引起人們的好奇和興奮。而AI的潛在優(yōu)勢,也剛剛開始在企業(yè)內(nèi)顯現(xiàn)出來。
然而,企業(yè)中人工智能的增長受到了阻礙,因為數(shù)據(jù)科學(xué)家通常無法獲得建立有效人工智能模型所需的相關(guān)數(shù)據(jù)。這些數(shù)據(jù)專家經(jīng)常被迫僅依賴于一些已知的來源,如現(xiàn)有的數(shù)據(jù)倉庫,而并不能利用他們所需的所有實時的真實數(shù)據(jù)。此外,許多公司很難有效且經(jīng)濟地確定大量數(shù)據(jù)的業(yè)務(wù)環(huán)境和質(zhì)量。鑒于這些困難,很容易理解AI在加速和應(yīng)用過程中的一些歷史障礙。
數(shù)據(jù)對AI有價值,用戶才能自信而安全地使用它來訓(xùn)練AI模型。實現(xiàn)這一目標的唯一方法是以“智能數(shù)據(jù)”為基礎(chǔ)。
多年來,我們已經(jīng)超越了數(shù)據(jù)的收集和聚合,以驅(qū)動特定的業(yè)務(wù)應(yīng)用程序(數(shù)據(jù)1.0),組織已經(jīng)能夠創(chuàng)建定義明確的流程,允許任何人訪問數(shù)據(jù),但這還遠遠不夠,我們現(xiàn)已達到了需要智能數(shù)據(jù)才能真正為企業(yè)范圍的轉(zhuǎn)型提供動力的數(shù)據(jù)(數(shù)據(jù)3.0)。
例如,考慮一家公司將嘗試重新定義其與客戶群的傳統(tǒng)關(guān)系所面臨的挑戰(zhàn),引導(dǎo)這種顛覆性變革需要來自眾多數(shù)據(jù)源,諸如數(shù)據(jù)庫,數(shù)據(jù)倉庫,應(yīng)用程序,大數(shù)據(jù)系統(tǒng),物聯(lián)網(wǎng),社交媒體等的輸入,各種數(shù)據(jù)類型,諸如結(jié)構(gòu)化,半結(jié)構(gòu)化和非結(jié)構(gòu)化,以及各種位置,諸如本地,云,混合和大數(shù)據(jù)等因素。
如今,數(shù)據(jù)湖正在成為信息變革時代所需大量不同數(shù)據(jù)的***存儲庫。但沒有智能數(shù)據(jù),這些湖泊價值不大。 Gartner此前曾預(yù)計,到2018年,90%的數(shù)據(jù)湖將毫無用處,因為它們充滿了原始數(shù)據(jù),很少有人會使用這些技術(shù)。
相比之下,通過智能數(shù)據(jù),數(shù)據(jù)科學(xué)家可以進行類似Google的搜索,并立即發(fā)現(xiàn)相關(guān)數(shù)據(jù)的所有潛在來源。智能數(shù)據(jù)可以節(jié)省大量寶貴的時間,數(shù)據(jù)科學(xué)家可能不得不花費時間來收集、組裝和改進模型所需的數(shù)據(jù)
那么如何確保數(shù)據(jù)真正智能化?通過構(gòu)建端到端數(shù)據(jù)管理平臺,該數(shù)據(jù)管理平臺本身使用機器學(xué)習和AI功能,由廣泛的元數(shù)據(jù)驅(qū)動,以提高平臺的整體生產(chǎn)力。元數(shù)據(jù)是釋放數(shù)據(jù)價值的關(guān)鍵。
如果用戶希望提供全面,相關(guān)且準確的數(shù)據(jù)來實施人工智能技術(shù),那么就需要查看四種不同的元數(shù)據(jù)類別:
- 技術(shù)元數(shù)據(jù) - 包括數(shù)據(jù)庫表和列信息以及有關(guān)數(shù)據(jù)質(zhì)量的統(tǒng)計信息。
- 業(yè)務(wù)元數(shù)據(jù) - 定義數(shù)據(jù)的業(yè)務(wù)上下文以及它參與的業(yè)務(wù)流程。
- 操作元數(shù)據(jù) - 有關(guān)軟件系統(tǒng)和流程執(zhí)行的信息。
- 使用元數(shù)據(jù) - 有關(guān)用戶活動的信息,包括訪問的數(shù)據(jù)集,評級和評論。
應(yīng)用于此元數(shù)據(jù)集合的AI和機器學(xué)習不僅有助于識別和推薦正確的數(shù)據(jù),該數(shù)據(jù)也可以自動處理——無需人工干預(yù),使其適用于企業(yè)AI項目。
數(shù)字化轉(zhuǎn)型,正在迫使組織以不同的方式審視數(shù)據(jù),這是成為“獵物或捕食者”的問題。如今,有實時可用的數(shù)據(jù)和工具訪問,可以實現(xiàn)快速分析,將促進了人工智能和機器學(xué)習,并允許過渡到數(shù)據(jù)優(yōu)先的方法。由于數(shù)字化、數(shù)據(jù)爆炸以及人工智能對企業(yè)的變革影響,人工智能帶來的信息技術(shù)變革正在蓬勃發(fā)展。
顯然,越來越多的數(shù)據(jù)輸入可能影響人工智能應(yīng)用程序的決策,因此組織需要對相關(guān)且有影響力的內(nèi)容進行分類整理。然而,在您的組織采用人工驅(qū)動的數(shù)據(jù)管理方法之前,請考慮以下問題:
您希望從AI中獲得什么?