經(jīng)得起未來考驗(yàn)的大數(shù)據(jù)戰(zhàn)略
?數(shù)據(jù)對(duì)技術(shù)領(lǐng)域內(nèi)外的企業(yè)都至關(guān)重要。特別是當(dāng)大數(shù)據(jù)遇到第二方和第三方數(shù)據(jù)的世界,承諾提供寶貴的見解,以推動(dòng)業(yè)務(wù)的各個(gè)方面發(fā)展。到目前為止,大多數(shù)企業(yè)已經(jīng)開始了他們的數(shù)據(jù)之旅。盡管企業(yè)在繁瑣但關(guān)鍵的數(shù)據(jù)成熟度追求中變得更加自如,但2023年將顛覆這一新發(fā)現(xiàn)。
發(fā)現(xiàn)或使用過生成式人工智能模型(如ChatGPT)的用戶,已經(jīng)有效地見證了成熟的數(shù)據(jù)和人工智能用例是如何從過度炒作轉(zhuǎn)變?yōu)楸夭豢缮俚墓ぞ?。然而,人們?cè)诖髷?shù)據(jù)之旅中遇到的同樣的障礙仍然存在,因此首先要了解如何管理大量數(shù)據(jù),并利用它們更好地做出決策。
大數(shù)據(jù)為企業(yè)提供了許多優(yōu)勢(shì),例如提高業(yè)務(wù)效率和預(yù)測(cè)未來的業(yè)務(wù)結(jié)果。但要想走在創(chuàng)新的前沿,科技領(lǐng)導(dǎo)者必須消除普遍存在的誤解,擁抱新興趨勢(shì)。
消除對(duì)大數(shù)據(jù)誤解
關(guān)于大數(shù)據(jù)的許多常見誤解依然存在。那么,需要消除的最主要的誤解是什么?利用大數(shù)據(jù)可以保證更好的決策。雖然大數(shù)據(jù)項(xiàng)目旨在從給定的數(shù)據(jù)點(diǎn)中發(fā)現(xiàn)一些關(guān)系和模式,但最終,成功的大數(shù)據(jù)項(xiàng)目取決于利益相關(guān)者如何解釋這些關(guān)系和模式。
人們也很容易忽略輸入決策系統(tǒng)或算法的偏差或錯(cuò)誤數(shù)據(jù)。在最好的情況下,這些偏見可能會(huì)使決策系統(tǒng)表現(xiàn)不佳;而在最壞的情況下,偏見可能會(huì)完全而危險(xiǎn)地誤導(dǎo)決策。與突破性發(fā)展并行的是,在過去的20年,人們也看到無數(shù)的項(xiàng)目成為糟糕規(guī)劃和誤解數(shù)據(jù)、問題或領(lǐng)域的犧牲品。
新的數(shù)據(jù)計(jì)劃伴隨著這些項(xiàng)目將取代數(shù)據(jù)倉庫工作的假設(shè)而出現(xiàn)。大數(shù)據(jù)平臺(tái)不應(yīng)單獨(dú)使用,而應(yīng)作為傳統(tǒng)數(shù)據(jù)管理系統(tǒng)的補(bǔ)充。結(jié)構(gòu)化數(shù)據(jù)和可預(yù)測(cè)的工作負(fù)載將始終彼此協(xié)同工作。如果沒有數(shù)據(jù)、人員和系統(tǒng)來驗(yàn)證黑盒算法,那么這些算法在使用或?yàn)E用時(shí)將繼續(xù)造成嚴(yán)重破壞。這些問題將引發(fā)一系列圍繞更負(fù)責(zé)任的人工智能以及不可避免的監(jiān)管的對(duì)話。
大數(shù)據(jù)的四大趨勢(shì)
隨著大數(shù)據(jù)變得無處不在,它將繼續(xù)以四種主要方式發(fā)展:元數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)結(jié)構(gòu)和圖表的使用增加,AutoML機(jī)器學(xué)習(xí)的民主化,生成式人工智能的大規(guī)模采用和顛覆,以及研發(fā)預(yù)算的減少。
(1)元數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)結(jié)構(gòu)
元數(shù)據(jù)驅(qū)動(dòng)的數(shù)據(jù)結(jié)構(gòu)用于連接不同的數(shù)據(jù)工具集合,這些工具具有極大的靈活性、用于建模的基礎(chǔ)設(shè)施和更大的數(shù)據(jù)集,可以驅(qū)動(dòng)真正的洞察。提高數(shù)據(jù)管理的敏捷性應(yīng)該是所有組織的優(yōu)先事項(xiàng),尤其是那些使用大數(shù)據(jù)為決策提供信息的組織。當(dāng)與元數(shù)據(jù)或“場(chǎng)景中的數(shù)據(jù)”交互時(shí),數(shù)據(jù)結(jié)構(gòu)允許集成不同的數(shù)據(jù)湖,并從正式結(jié)構(gòu)化的數(shù)據(jù)架構(gòu)結(jié)構(gòu)中提取知識(shí)圖。數(shù)據(jù)結(jié)構(gòu)偵聽、學(xué)習(xí)元數(shù)據(jù)并對(duì)其進(jìn)行操作,從而創(chuàng)建一個(gè)更加自主和用戶友好的數(shù)據(jù)覆蓋系統(tǒng)。
根據(jù)Gartner公司發(fā)布的一份報(bào)告,數(shù)據(jù)結(jié)構(gòu)中的主動(dòng)元數(shù)據(jù)輔助自動(dòng)化功能將會(huì)減少三分之一的人力,同時(shí)將數(shù)據(jù)利用率提高四倍。部署這種數(shù)據(jù)結(jié)構(gòu)方法的主要目標(biāo)是通過增加對(duì)場(chǎng)景化信息的訪問和理解,為大數(shù)據(jù)提供更多價(jià)值。
(2)民主化機(jī)器學(xué)習(xí)
對(duì)于那些使用大數(shù)據(jù)的人來說,進(jìn)行廣泛開發(fā)的機(jī)會(huì)是利用AutoML使機(jī)器學(xué)習(xí)大眾化。AutoML是一類機(jī)器學(xué)習(xí)算法,它有助于自動(dòng)化機(jī)器學(xué)習(xí)模型的設(shè)計(jì)和訓(xùn)練。由于其簡(jiǎn)化的方法和流程,AutoML擴(kuò)大了大數(shù)據(jù)和機(jī)器學(xué)習(xí)的使用,使其更適合用戶使用。使用AutoML的目標(biāo)是構(gòu)建用戶能夠創(chuàng)建自己的機(jī)器學(xué)習(xí)模型的算法,而不是需要人工輸入未來的機(jī)器學(xué)習(xí)模型。
在現(xiàn)實(shí)中,觀察到越來越多的企業(yè)使用AutoML來授權(quán)具有缺乏數(shù)據(jù)科學(xué)專業(yè)知識(shí)的員工來構(gòu)建健壯的模型。與生成式人工智能一樣,自動(dòng)人工智能在應(yīng)用于正確的問題時(shí)是一個(gè)令人難以置信的工具,但如果在公民數(shù)據(jù)科學(xué)的背景下使用,它可能是危險(xiǎn)的——這是開箱即用的工具,沒有什么過程或思想。自動(dòng)人工智能系統(tǒng)可以讓用戶快速構(gòu)建,但它也可以使算法和分析不像它們看起來的那么好,或者可能產(chǎn)生有偏見的結(jié)果。這些陷阱非常普遍,毫無疑問,這些工具功能強(qiáng)大且快速,但它們需要專業(yè)知識(shí)和大量數(shù)據(jù)。
(3)生成的人工智能
GPT3和ChatGPT已經(jīng)展示了大型語言模型(LLM)的強(qiáng)大功能和質(zhì)量。雖然大型語言模型(LLM)已經(jīng)存在了一段時(shí)間,但ChatGPT提醒了人工智能的潛力和成熟狀態(tài),以及它以復(fù)雜和通用的方式處理和創(chuàng)造的能力。其結(jié)果將是其用例的激增,這將擴(kuò)展應(yīng)用人工智能的方式。
(4)減少研發(fā)預(yù)算
數(shù)據(jù)多樣性的增加和分析方法的進(jìn)步使得商業(yè)結(jié)果在大數(shù)據(jù)計(jì)劃中變得至關(guān)重要。隨著大數(shù)據(jù)和內(nèi)部流程的優(yōu)化越來越成為組織的核心,采用大數(shù)據(jù)項(xiàng)目減少了研發(fā)預(yù)算。首席數(shù)據(jù)官以及企業(yè)內(nèi)部專門的數(shù)據(jù)實(shí)踐和團(tuán)隊(duì)的出現(xiàn)進(jìn)一步加劇了這一趨勢(shì)。
大數(shù)據(jù)不是一個(gè)設(shè)置即忘的過程
在考慮數(shù)據(jù)策略時(shí),需要勤奮地工作以確保正在構(gòu)建的決策系統(tǒng)獲得良好的結(jié)果。使用生成式人工智能或公民人工智能工具實(shí)現(xiàn)目標(biāo)變得越來越容易。然而,組織必須有意識(shí)地處理如何收集、存儲(chǔ)、組織和清理數(shù)據(jù)。否則,很容易得出錯(cuò)誤的結(jié)果。
定義大數(shù)據(jù)成功的一些核心因素包括創(chuàng)建備份決策系統(tǒng)來證實(shí)結(jié)果,并為該計(jì)劃分配足夠的資金和。此外,始終確保將盡可能多的行業(yè)知識(shí)注入到?jīng)Q策系統(tǒng)的構(gòu)建和部署中。?