如何解決企業(yè)AI的巨大挑戰(zhàn)
在過(guò)去兩年中已生成了90%的現(xiàn)有數(shù)據(jù)。 每天產(chǎn)生7.5億兆字節(jié)的數(shù)據(jù)-每人約147,000千兆字節(jié)。 這些數(shù)字驚人,但可以預(yù)料:世界在增長(zhǎng),而機(jī)器經(jīng)濟(jì)也在以指數(shù)級(jí)增長(zhǎng)。
這并不是說(shuō)所有這些數(shù)據(jù)都立即有用。 如果沒(méi)有大量的預(yù)處理,組織就不能簡(jiǎn)單地利用這些資源,但是有人在工作嗎? Forrester報(bào)告稱,在企業(yè)公司內(nèi)部,仍有73%的數(shù)據(jù)未用于分析。 業(yè)務(wù)策略和數(shù)據(jù)策略之間仍然存在很大的差距-您組織的預(yù)測(cè)性解決方案將僅與初始問(wèn)題陳述一樣堅(jiān)固。 根據(jù)Gartner的說(shuō)法,組織需要建立特定的用例,并部署具有可衡量結(jié)果的技術(shù),以實(shí)現(xiàn)AI的價(jià)值。
數(shù)據(jù)是一大難題
這個(gè)比喻仍然存在-數(shù)據(jù)就是新的石油(盡管最晚在2006年創(chuàng)造了這個(gè)詞,也許并不是那么"新")。 在原始狀態(tài)下絕對(duì)有價(jià)值。 精制后,它甚至更有價(jià)值。 但是,當(dāng)將其轉(zhuǎn)變成專門(mén)為解決特定問(wèn)題而設(shè)計(jì)的產(chǎn)品時(shí),其應(yīng)用將無(wú)數(shù),其價(jià)值將飛速增長(zhǎng)。
數(shù)據(jù)也是如此:組織需要記住,這里的最終目標(biāo)不是收集盡可能多的數(shù)據(jù)。 他們需要從數(shù)據(jù)中提取價(jià)值并將其應(yīng)用于特定的業(yè)務(wù)問(wèn)題。 觀察數(shù)據(jù),從中學(xué)習(xí)數(shù)據(jù),然后基于該反饋使工作自動(dòng)化的想法是機(jī)器學(xué)習(xí)的核心。
> GIF via giphy
盡管好萊塢經(jīng)常描述這種情況,但ML并沒(méi)有朝著證明"終結(jié)者假說(shuō)"的方向發(fā)展。
了解機(jī)器學(xué)習(xí)
在任何組織成為數(shù)據(jù)驅(qū)動(dòng)者之前,了解基礎(chǔ)知識(shí)很重要。 人們通常認(rèn)為機(jī)器學(xué)習(xí)的最終目標(biāo)是對(duì)實(shí)時(shí)儀表板上顯示的數(shù)據(jù)進(jìn)行圖形化和可視化處理。 ML與自動(dòng)執(zhí)行任務(wù)有關(guān)(而不是與替換工作有關(guān)),而不僅僅是顯示統(tǒng)計(jì)信息。 廣義上講,機(jī)器學(xué)習(xí)向計(jì)算機(jī)教授有關(guān)世界的知識(shí),以便機(jī)器可以使用該知識(shí)執(zhí)行其他任務(wù)。 另一方面,統(tǒng)計(jì)信息可以教給人們一些有關(guān)世界的知識(shí),以便他們可以看到更大的圖景并做出明智的決策。
埃森哲稱,與那些追求概念驗(yàn)證的公司相比,從戰(zhàn)略上擴(kuò)展AI的公司報(bào)告的AI投資回報(bào)幾乎是其三倍。 顯然,ML并不是一些笨拙的儀表板; 實(shí)際上,它可以幫助您的組織構(gòu)建可以模仿,擴(kuò)展和增強(qiáng)人類智能的智能系統(tǒng),以實(shí)現(xiàn)某些"機(jī)器智能",從而使組織中的人員可以專注于解決更適合人類的問(wèn)題。
但是,大多數(shù)組織都在努力實(shí)現(xiàn)可擴(kuò)展的AI解決方案,并且沒(méi)有從中受益(參見(jiàn):金錢(qián))。 問(wèn)題? 您的組織不是人才短缺,而是戰(zhàn)略短缺。 不服氣嗎? 我們來(lái)看一些數(shù)字。
可擴(kuò)展的解決方案
自2015年以來(lái),數(shù)據(jù)科學(xué)工作需求增長(zhǎng)了344%。 我們可以清楚地看到,組織正在投資發(fā)展其數(shù)據(jù)科學(xué)團(tuán)隊(duì),給人的印象是,如果他們繼續(xù)聘用數(shù)據(jù)科學(xué)家,創(chuàng)新和數(shù)字化轉(zhuǎn)型將自動(dòng)成為副產(chǎn)品。 但是,僅使用了27%的企業(yè)數(shù)據(jù),而將外部數(shù)據(jù)考慮在內(nèi)則更加令人震驚-在世界上所有可用數(shù)據(jù)中,只有不到1%用于分析。
所有這些數(shù)據(jù)都有一個(gè)臨界點(diǎn)。 公司可以花費(fèi)數(shù)百萬(wàn)美元來(lái)組建龐大的數(shù)據(jù)團(tuán)隊(duì),以搜尋Internet到處尋找和準(zhǔn)備數(shù)據(jù)的方法-但這永遠(yuǎn)不是可擴(kuò)展的解決方案,而且缺乏管理策略會(huì)造成瓶頸。
公司需要什么來(lái)部署AI和ML?
那么,流程從哪里開(kāi)始,組織如何實(shí)際構(gòu)建和部署成功的機(jī)器學(xué)習(xí)項(xiàng)目?
(1) 從結(jié)局開(kāi)始。 您必須清楚地了解自己面臨的問(wèn)題以及想要實(shí)現(xiàn)的解決方案。 在保齡球比賽中,每個(gè)球都可以擊倒十個(gè)針腳,但是如果您朝正確的方向扔球,那將是一場(chǎng)完美的比賽。 使用ML,您需要了解您的目標(biāo)。 組織以目標(biāo)為導(dǎo)向,他們一直在尋求增加收入和提高KPI-如果您的問(wèn)題不能解決這些目標(biāo),則可能會(huì)偏離目標(biāo)。
(2) 提出正確的問(wèn)題。 大多數(shù)企業(yè)在嘗試解決ML問(wèn)題之前并沒(méi)有提出正確的問(wèn)題。 分析并了解您可以回答的內(nèi)容和無(wú)法回答的內(nèi)容,然后弄清楚您的預(yù)測(cè)系統(tǒng)如何使最終用戶真正受益。 要問(wèn)的一個(gè)關(guān)鍵問(wèn)題:"我的項(xiàng)目會(huì)被它可以為組織創(chuàng)造的價(jià)值深深地驅(qū)動(dòng)嗎?"
(3) 定義業(yè)務(wù)策略。 必須使用將應(yīng)用于其他項(xiàng)目的數(shù)據(jù)和ML項(xiàng)目來(lái)實(shí)現(xiàn)相同的策略制定細(xì)節(jié)。 您需要特定,可衡量和可實(shí)現(xiàn)的目標(biāo),實(shí)施計(jì)劃以及有助于跟蹤項(xiàng)目成功的指標(biāo)。 僅從技術(shù)層面上看項(xiàng)目是不夠的,您需要能夠?qū)⒔鉀Q方案連接到您的組織。 例如,在實(shí)施模型之后,您的公司會(huì)增加收入還是在市場(chǎng)上獲得牢固的競(jìng)爭(zhēng)優(yōu)勢(shì)?
(4) 建立合適的團(tuán)隊(duì)。 組織常常無(wú)法招到合適的人選,因?yàn)樗麄円床恢雷约合胍獙?shí)現(xiàn)的目標(biāo),要么對(duì)數(shù)據(jù)科學(xué)家的角色有相互矛盾的認(rèn)識(shí)。 數(shù)據(jù)團(tuán)隊(duì)不僅由數(shù)據(jù)科學(xué)家組成,而且由更多的角色組成,并且認(rèn)為一個(gè)角色能夠建立和維護(hù)倉(cāng)庫(kù),架構(gòu)數(shù)據(jù)工作流程,編寫(xiě)完美優(yōu)化的機(jī)器學(xué)習(xí)算法并對(duì)所有內(nèi)容進(jìn)行分析都是無(wú)知的。 為了填補(bǔ)項(xiàng)目的正確角色,您需要明確定義目標(biāo),了解每個(gè)技術(shù)角色/團(tuán)隊(duì)結(jié)構(gòu)的細(xì)微差別,并確保在招聘信息中列出所有這些內(nèi)容。 下圖顯示了核心技能對(duì)于數(shù)據(jù)科學(xué)中新興角色的相對(duì)重要性:
> Chart of skill importance in Data Science
(5) 創(chuàng)建數(shù)據(jù)策略路線圖。 數(shù)據(jù)是ML項(xiàng)目訓(xùn)練模型的關(guān)鍵資產(chǎn)。 根據(jù)人工智能領(lǐng)域的先驅(qū)Andrew Ng所說(shuō),最大,最成功的產(chǎn)品擁有最多的用戶。 擁有最多的用戶通常意味著您可以獲得最多的數(shù)據(jù),而對(duì)于現(xiàn)代ML,擁有最多的數(shù)據(jù)通常意味著您可以創(chuàng)建良好的AI。 下圖描述了以上概念:
(6) 利用第三方軟件。 不要試圖徹底改變現(xiàn)狀并建立內(nèi)部數(shù)據(jù)管道。 為了成功啟動(dòng)AI,重要的是選擇正確的工具,這些工具可以幫助您的組織完成在采購(gòu),抓取,標(biāo)準(zhǔn)化,優(yōu)化和集成數(shù)據(jù)方面可以自動(dòng)化的任務(wù)。 代表Alegion進(jìn)行的Dimensional Research報(bào)告發(fā)現(xiàn),最終,有71%的團(tuán)隊(duì)將培訓(xùn)數(shù)據(jù)和其他機(jī)器學(xué)習(xí)項(xiàng)目活動(dòng)外包。 在"建造與購(gòu)買(mǎi)"辯論中,選擇"建造"的公司花費(fèi)更多的時(shí)間和金錢(qián)。 請(qǐng)記住,您不是在雇用數(shù)據(jù)管理員,而是在雇用數(shù)據(jù)科學(xué)家。 采用DataOps工具并找到使數(shù)據(jù)生命周期的準(zhǔn)備階段和過(guò)程階段自動(dòng)化的方法,將會(huì)縮短洞察時(shí)間。
從來(lái)都不是容易的事,但不必那么難
一些企業(yè)沒(méi)有足夠的數(shù)據(jù),另一些企業(yè)則在掙扎著十多年無(wú)法使用的價(jià)值。 擁有數(shù)據(jù)并不自動(dòng)意味著可以從中獲得見(jiàn)解。 組織無(wú)法識(shí)別從數(shù)據(jù)中獲取見(jiàn)解所需的必要準(zhǔn)備工作,因此,在創(chuàng)新和增長(zhǎng)方面會(huì)出現(xiàn)越來(lái)越多的瓶頸。 不是沒(méi)有數(shù)據(jù),而是可用數(shù)據(jù)。
數(shù)據(jù)是創(chuàng)建預(yù)測(cè)性和智能解決方案的重要因素,但是數(shù)據(jù)不僅擁有很多,而且還有更多。 找到問(wèn)題,找到合適的人來(lái)解決它,并為他們提供有效解決問(wèn)題和衡量其效力所需的工具-這些是成功ML的要求。