數(shù)據(jù)管理的5種辨認方法:檢測企業(yè)是否為現(xiàn)代化AI做好準(zhǔn)備
下一代人工智能技術(shù)之于企業(yè),就像智能手機之于青少年:幾乎每個人都想用,但并不是每個人都準(zhǔn)備好正確的使用方法。
對于青少年來說,智能手機是必備商品,標(biāo)志著成熟和對未來的擁抱。但要更好地用好一部手機,青少年應(yīng)該表現(xiàn)出一定程度的技術(shù)能力。同樣,如今大多數(shù)企業(yè)都渴望采用現(xiàn)代人工智能技術(shù),例如大型語言模型。但是,根據(jù)其數(shù)據(jù)管理實踐的成熟度,他們可能已經(jīng)準(zhǔn)備好或可能還沒有準(zhǔn)備好實施此類技術(shù)。
現(xiàn)在,我們要定期為企業(yè)提供建議,幫助他們確定是否具備充分利用人工智能所需的數(shù)據(jù)管理策略。
為什么現(xiàn)代人工智能的時機已來
我們知道,人工智能是目前最熱門的趨勢之一。特別是生成式人工智能技術(shù)的日益成熟,使企業(yè)敏銳地意識到現(xiàn)代人工智能解決方案帶來了更多更大的潛力,將會為企業(yè)帶來更好地競爭優(yōu)勢。當(dāng)然, 這取決于企業(yè)管理者接受人工智能技術(shù)的程度。
事實上,即使有些企業(yè)尚未開始嘗試大型語言模型等技術(shù),現(xiàn)在也需要開始布局了。我們認為,在下一代人工智能的幫助下,獲得競爭優(yōu)勢的窗口已然敞開,但是也并不會永遠保持這種狀態(tài)。因此,不盡快采取行動的企業(yè),將會被拋在隊伍后面。
您的數(shù)據(jù)管理策略是否為 AI 做好了準(zhǔn)備? 實際上,僅僅因為企業(yè)想要人工智能,并不意味著他們已經(jīng)準(zhǔn)備好了。在加入 AI 之前,企業(yè)需要評估其數(shù)據(jù)管理策略,并評估該策略在部署和使用下一代 AI 技術(shù)方面的優(yōu)勢。
要做好數(shù)據(jù)管理策略,必須考慮以下五個最重要的因素
1、數(shù)據(jù)質(zhì)量
數(shù)據(jù)質(zhì)量對于應(yīng)用人工智能技術(shù)至關(guān)重要。如果使用低質(zhì)量數(shù)據(jù)訓(xùn)練 AI 模型,則模型將做出低質(zhì)量或不一致的決策。因此,能夠評估和優(yōu)化數(shù)據(jù)質(zhì)量是利用人工智能的關(guān)鍵要求。
數(shù)據(jù)質(zhì)量首先要定義反映數(shù)據(jù)準(zhǔn)確性、完整性和一致性的指標(biāo),然后定期(或最好連續(xù))衡量這些指標(biāo)。此外,企業(yè)應(yīng)該有適當(dāng)?shù)墓ぞ吆土鞒虂硖岣邤?shù)據(jù)質(zhì)量,例如,從數(shù)據(jù)集中刪除冗余信息或刪除可能代表不準(zhǔn)確數(shù)據(jù)點的異常值。
2、數(shù)據(jù)可訪問性
如果 AI 算法和模型難以訪問企業(yè)中的數(shù)據(jù),那么在 AI 方面不會走得太遠。因此,企業(yè)需要一種數(shù)據(jù)管理策略來確保數(shù)據(jù)的可訪問性,這意味著企業(yè)擁有的所有數(shù)據(jù)都可以輕松連接到想要使用它的應(yīng)用程序(包括 AI 應(yīng)用程序)或與之集成的其它應(yīng)用程序。
在處理“普通”類型的數(shù)據(jù)(如數(shù)據(jù)庫)時,數(shù)據(jù)可訪問性的重要性通常是顯而易見的。但請記住,數(shù)據(jù)可訪問性對于其他類型的數(shù)據(jù)也至關(guān)重要,例如半結(jié)構(gòu)化、非結(jié)構(gòu)化和“暗”數(shù)據(jù),所有這些數(shù)據(jù)也可能在 AI 用例中發(fā)揮作用。
3、數(shù)據(jù)靈活性
只能以一種形式提供且無法重組的數(shù)據(jù)對 AI 來說并不是很有用,只能在小規(guī)?;蛱囟ㄅ渲孟略L問的數(shù)據(jù)也不是。
為了充分利用 AI,企業(yè)需要盡可能靈活的數(shù)據(jù)。無論處理的數(shù)據(jù)量、結(jié)構(gòu)或存儲位置如何,數(shù)據(jù)管理工具和流程都應(yīng)允許將數(shù)據(jù)應(yīng)用于任何 AI 用例。有時,這樣做需要進行更改,例如將數(shù)據(jù)遷移到新的存儲平臺或?qū)⑵滢D(zhuǎn)換為其他格式。
4、數(shù)據(jù)治理
與現(xiàn)代 AI 相關(guān)的一個關(guān)鍵挑戰(zhàn)是,企業(yè)并不總是知道 AI 模型如何處理數(shù)據(jù),尤其是在使用第三方 AI 服務(wù)時。
因此,數(shù)據(jù)治理是負責(zé)任地使用 AI 的關(guān)鍵支柱。數(shù)據(jù)治理允許企業(yè)建立有關(guān)不同數(shù)據(jù)資產(chǎn)的使用位置和方式的規(guī)則。例如,企業(yè)可能對一些數(shù)據(jù)過于敏感,無法向第三方 AI 服務(wù)公開。借助數(shù)據(jù)治理策略,可以制定明確的策略來定義 AI 模型如何使用數(shù)據(jù)。
5、數(shù)據(jù)管理
建立數(shù)據(jù)治理規(guī)則是一回事,執(zhí)行它們是另一回事,這就是數(shù)據(jù)管理的用武之地。
數(shù)據(jù)管理允許企業(yè)制定實施流程,以確保團隊在處理數(shù)據(jù)時遵循數(shù)據(jù)治理和質(zhì)量規(guī)則。適當(dāng)?shù)臄?shù)據(jù)管理可以防范 AI 模型帶來的風(fēng)險,以及其他挑戰(zhàn)。
在 AI 時代充分利用數(shù)據(jù)
長期以來,數(shù)據(jù)一直是業(yè)務(wù)成功的關(guān)鍵因素。但是,下一代人工智能技術(shù)使得企業(yè)充分利用其掌握的數(shù)據(jù)變得更加重要。
然而,正如我們每天在幫助公司實現(xiàn)數(shù)據(jù)管理戰(zhàn)略現(xiàn)代化時所提醒的那樣,一些企業(yè)比其他企業(yè)更愿意利用人工智能,因為有些企業(yè)比其他企業(yè)擁有更成熟的數(shù)據(jù)管理實踐。在嘗試采用 AI 技術(shù)之前,發(fā)現(xiàn)您的數(shù)據(jù)管理策略還不夠成熟,無法支持它,請評估您如何管理數(shù)據(jù),然后在開始實施 AI 之前識別并解決問題。
原文標(biāo)題:Is Your Data Management Strategy Ready for AI? 5 Ways to Tell
原文作者:Daniel Zagales