研究表明：數(shù)據(jù)來(lái)源仍然是 AI 的主要瓶頸

作者：佚名 2022-08-19 15:17:44

“數(shù)據(jù)準(zhǔn)確性對(duì)于 AI 和 ML 模型的成功至關(guān)重要，因?yàn)橘|(zhì)量豐富的數(shù)據(jù)會(huì)產(chǎn)生更好的模型輸出以及一致的處理和決策制定，”

數(shù)據(jù)是機(jī)器的命脈。沒有它，你就無(wú)法構(gòu)建任何與 AI 相關(guān)的東西。根據(jù) Appen 本周發(fā)布的 AI 和機(jī)器學(xué)習(xí)狀況報(bào)告，許多組織仍在努力獲取良好、干凈的數(shù)據(jù)以維持其 AI 和機(jī)器學(xué)習(xí)計(jì)劃。

根據(jù)Appen對(duì)人工智能的調(diào)查，在人工智能的四個(gè)階段——數(shù)據(jù)采購(gòu)、數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練和部署以及人工指導(dǎo)的模型評(píng)估中，數(shù)據(jù)采購(gòu)消耗的資源最多、花費(fèi)的時(shí)間最多、最具挑戰(zhàn)性。 504 位商業(yè)領(lǐng)袖和技術(shù)專家。

根據(jù) Appen 的調(diào)查，平均而言，數(shù)據(jù)采購(gòu)消耗組織人工智能預(yù)算的 34%，而數(shù)據(jù)準(zhǔn)備和模型測(cè)試和部署各占 24%，模型評(píng)估各占 15%，該調(diào)查由 Harris Poll 進(jìn)行，包括 IT 決策者、來(lái)自美國(guó)、英國(guó)、愛爾蘭和德國(guó)的商業(yè)領(lǐng)袖和經(jīng)理以及技術(shù)從業(yè)者。

就時(shí)間而言，數(shù)據(jù)采購(gòu)消耗組織大約 26% 的時(shí)間，而數(shù)據(jù)準(zhǔn)備和模型測(cè)試、部署和模型評(píng)估分別占 24% 和 23%。最后，與模型評(píng)估 (41%)、模型測(cè)試和部署 (38%) 以及數(shù)據(jù)準(zhǔn)備 (34%) 相比，42% 的技術(shù)人員認(rèn)為數(shù)據(jù)采購(gòu)是 AI 生命周期中最具挑戰(zhàn)性的階段。

研究表明：數(shù)據(jù)來(lái)源仍然是 AI 的主要瓶頸

據(jù)技術(shù)專家稱，數(shù)據(jù)采購(gòu)是人工智能面臨的最大挑戰(zhàn)。但商界領(lǐng)袖對(duì)事物的看法不同……

盡管存在挑戰(zhàn)，但組織正在使其發(fā)揮作用。據(jù) Appen 稱，五分之四 (81%) 的受訪者表示，他們有信心擁有足夠的數(shù)據(jù)來(lái)支持他們的人工智能計(jì)劃。這一成功的關(guān)鍵可能在于：絕大多數(shù) (88%) 正在通過(guò)使用外部 AI 訓(xùn)練數(shù)據(jù)提供商（例如 Appen）來(lái)擴(kuò)充他們的數(shù)據(jù)。

然而，數(shù)據(jù)的準(zhǔn)確性是有問(wèn)題的。Appen 發(fā)現(xiàn)，只有 20% 的調(diào)查對(duì)象報(bào)告數(shù)據(jù)準(zhǔn)確率超過(guò) 80%。只有 6%（約十分之一的人）表示他們的數(shù)據(jù)準(zhǔn)確度為 90% 或更高。換句話說(shuō)，五分之一的數(shù)據(jù)包含超過(guò) 80% 的組織的錯(cuò)誤。

考慮到這一點(diǎn)，根據(jù) Appen 的調(diào)查，近一半 (46%) 的受訪者同意數(shù)據(jù)準(zhǔn)確性很重要，“但我們可以解決它”，這也許并不奇怪。只有 2% 的人表示數(shù)據(jù)準(zhǔn)確性不是一個(gè)大需求，而 51% 的人同意這是一個(gè)關(guān)鍵需求。

看來(lái)，Appen 首席技術(shù)官 Wilson Pang 對(duì)數(shù)據(jù)質(zhì)量重要性的看法與 48% 的客戶認(rèn)為數(shù)據(jù)質(zhì)量不重要。

“數(shù)據(jù)準(zhǔn)確性對(duì)于 AI 和 ML 模型的成功至關(guān)重要，因?yàn)橘|(zhì)量豐富的數(shù)據(jù)會(huì)產(chǎn)生更好的模型輸出以及一致的處理和決策制定，”Pang 在報(bào)告中說(shuō)?！盀榱双@得良好的結(jié)果，數(shù)據(jù)集必須準(zhǔn)確、全面且可擴(kuò)展。”

研究表明：數(shù)據(jù)來(lái)源仍然是 AI 的主要瓶頸

超過(guò) 90% 的 Appen 受訪者表示他們使用預(yù)先標(biāo)記的數(shù)據(jù)

Pang在最近的一次采訪中告訴表示，深度學(xué)習(xí)和以數(shù)據(jù)為中心的 AI 的興起已將 AI 成功的動(dòng)力從良好的數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)建模轉(zhuǎn)變?yōu)榱己玫臄?shù)據(jù)收集、管理和標(biāo)記。對(duì)于當(dāng)今的遷移學(xué)習(xí)技術(shù)來(lái)說(shuō)尤其如此，人工智能從業(yè)者從一個(gè)大型預(yù)訓(xùn)練語(yǔ)言或計(jì)算機(jī)視覺模型的頂部跳出來(lái)，用他們自己的數(shù)據(jù)重新訓(xùn)練一小部分層。

更好的數(shù)據(jù)還可以幫助防止不必要的偏見滲入 AI 模型，并通常防止 AI 出現(xiàn)不良結(jié)果。澳鵬人工智能專家高級(jí)主管 Ilia Shifrin 表示，對(duì)于大型語(yǔ)言模型尤其如此。

“隨著基于多語(yǔ)言網(wǎng)絡(luò)爬蟲數(shù)據(jù)訓(xùn)練的大型語(yǔ)言模型 (LLM) 的興起，公司面臨著另一個(gè)挑戰(zhàn)，”Shifrin 在報(bào)告中說(shuō)?！坝捎诖罅坑卸镜恼Z(yǔ)言，以及訓(xùn)練語(yǔ)料庫(kù)中的種族、性別和宗教偏見，這些模型經(jīng)常表現(xiàn)出不良行為。”

Web 數(shù)據(jù)中的偏見引發(fā)了一些棘手的問(wèn)題，雖然有一些變通方法（改變訓(xùn)練方案、過(guò)濾訓(xùn)練數(shù)據(jù)和模型輸出，以及從人類反饋和測(cè)試中學(xué)習(xí)），但需要更多的研究來(lái)為“以人為中心”建立一個(gè)良好的標(biāo)準(zhǔn)Shifrin 說(shuō)，LLM 基準(zhǔn)和模型評(píng)估方法。

據(jù) Appen 稱，數(shù)據(jù)管理仍然是 AI 面臨的最大障礙。調(diào)查發(fā)現(xiàn)，人工智能循環(huán)中 41% 的人認(rèn)為數(shù)據(jù)管理是最大的瓶頸。缺乏數(shù)據(jù)排在第四位，30% 的人認(rèn)為這是 AI 成功的最大障礙。

但也有一些好消息：組織花在管理和準(zhǔn)備數(shù)據(jù)上的時(shí)間呈下降趨勢(shì)。Appen 說(shuō)，今年這一比例剛剛超過(guò) 47%，而去年的報(bào)告中為 53%。

研究表明：數(shù)據(jù)來(lái)源仍然是 AI 的主要瓶頸

數(shù)據(jù)準(zhǔn)確性水平可能沒有某些組織希望的那么高

“大多數(shù)受訪者使用外部數(shù)據(jù)提供商，可以推斷，通過(guò)外包數(shù)據(jù)采購(gòu)和準(zhǔn)備，數(shù)據(jù)科學(xué)家正在節(jié)省正確管理、清理和標(biāo)記數(shù)據(jù)所需的時(shí)間，”數(shù)據(jù)標(biāo)簽公司表示。

然而，從數(shù)據(jù)中相對(duì)較高的錯(cuò)誤率來(lái)看，也許組織不應(yīng)該縮減他們的數(shù)據(jù)采購(gòu)和準(zhǔn)備流程（無(wú)論是內(nèi)部的還是外部的）。在建立和維護(hù) AI 流程方面存在許多相互競(jìng)爭(zhēng)的需求——聘用合格的數(shù)據(jù)專業(yè)人員是澳鵬確定的另一個(gè)首要需求。但是，在數(shù)據(jù)管理方面取得重大進(jìn)展之前，組織應(yīng)繼續(xù)對(duì)其團(tuán)隊(duì)施加壓力，以繼續(xù)推動(dòng)數(shù)據(jù)質(zhì)量的重要性。

調(diào)查還發(fā)現(xiàn)，93% 的組織強(qiáng)烈或在某種程度上同意道德 AI 應(yīng)該是 AI 項(xiàng)目的“基礎(chǔ)”。Appen 首席執(zhí)行官 Mark Brayan 表示，這是一個(gè)良好的開端，但還有很多工作要做?！皢?wèn)題是，許多人都面臨著試圖用糟糕的數(shù)據(jù)集構(gòu)建偉大的人工智能的挑戰(zhàn)，這為實(shí)現(xiàn)他們的目標(biāo)創(chuàng)造了一個(gè)重要的障礙，” Brayan 在一份新聞稿中說(shuō)。

根據(jù) Appen 的報(bào)告，內(nèi)部、自定義收集的數(shù)據(jù)仍然是用于 AI 的組織的大部分?jǐn)?shù)據(jù)集，占數(shù)據(jù)的 38% 到 42%。合成數(shù)據(jù)的表現(xiàn)出乎意料地強(qiáng)勁，占組織數(shù)據(jù)的 24% 到 38%，而預(yù)先標(biāo)記的數(shù)據(jù)（通常來(lái)自數(shù)據(jù)服務(wù)提供商）占數(shù)據(jù)的 23% 到 31%。

特別是合成數(shù)據(jù)有可能減少敏感人工智能項(xiàng)目中的偏見發(fā)生率，97% 的澳鵬受訪者表示他們“在開發(fā)包容性訓(xùn)練數(shù)據(jù)集時(shí)”使用合成數(shù)據(jù)。

該報(bào)告的其他有趣發(fā)現(xiàn)包括：