為了創(chuàng)造商業(yè)價(jià)值,需要充分利用企業(yè)的數(shù)據(jù)和人工智能
盡管人們生活在一個(gè)日益數(shù)據(jù)驅(qū)動(dòng)的世界,但大多數(shù)公司并沒有采用數(shù)據(jù)驅(qū)動(dòng)的商業(yè)模式。推動(dòng)Alphabet、Meta和亞馬遜等企業(yè)成功的網(wǎng)絡(luò)效應(yīng)良性循環(huán),并不適用于銷售傳統(tǒng)產(chǎn)品和服務(wù)的組織。然而,從日常業(yè)務(wù)流程生成的專有數(shù)據(jù)中獲取更多信息的工具正在變得廣泛可用,并且可以幫助企業(yè)開發(fā)競(jìng)爭(zhēng)優(yōu)勢(shì)。
隨著市場(chǎng)競(jìng)爭(zhēng)變得更加激烈,從數(shù)據(jù)中建立一個(gè)可防御的護(hù)城河可以讓一切變得不同。麥肯錫公司估計(jì),利用內(nèi)部數(shù)據(jù)進(jìn)行銷售和營(yíng)銷洞察可以帶來高于平均水平的市場(chǎng)增長(zhǎng),并使收入增加15%至25%。大型語言模型(LLM)提供了一種新的、獨(dú)特的方式來提取這種價(jià)值,對(duì)他們進(jìn)行專有數(shù)據(jù)培訓(xùn),以實(shí)現(xiàn)特定的商業(yè)目標(biāo),可能會(huì)改變?cè)S多公司。
數(shù)據(jù)的質(zhì)量大于數(shù)量
正如人工智能大師、谷歌公司前研究總監(jiān)Peter Norvig曾經(jīng)說過的那樣,“更多的數(shù)據(jù)勝過更好的算法,但更好的數(shù)據(jù)勝過更多的數(shù)據(jù)?!彪S著通用人工智能模型適應(yīng)于企業(yè)使用,這一點(diǎn)變得越來越真實(shí)。雖然前沿模型已經(jīng)接受了從互聯(lián)網(wǎng)和其他公共資源中收集的大量數(shù)據(jù)的訓(xùn)練,但它們?cè)谔囟ㄉ虡I(yè)目的上的效用有限。
這些大型語言模型從數(shù)據(jù)中提取意義的能力需要與組織獨(dú)有的專有數(shù)據(jù)相結(jié)合,才能實(shí)現(xiàn)真正的利益。一旦設(shè)定了業(yè)務(wù)目標(biāo),確保為此準(zhǔn)備好數(shù)據(jù)是關(guān)鍵的一步。Gartner公司估計(jì),為人工智能準(zhǔn)備數(shù)據(jù)可以將業(yè)務(wù)成果提高20%,這意味著數(shù)據(jù)必須適合預(yù)期的用例,無論是結(jié)構(gòu)化還是非結(jié)構(gòu)化。Gartner公司聲稱,30%的內(nèi)部人工智能項(xiàng)目被放棄的一個(gè)關(guān)鍵原因是數(shù)據(jù)質(zhì)量差。這包括刪除損壞的數(shù)據(jù)和重復(fù)的數(shù)據(jù),以及填補(bǔ)輸入不完整的空白。
雖然質(zhì)量是關(guān)鍵,但也需要足夠的數(shù)量。根據(jù)目標(biāo)和LLM的調(diào)優(yōu)方式,這意味著至少需要數(shù)千條記錄,甚至可能更多。
使用獨(dú)特的專有數(shù)據(jù)可以實(shí)現(xiàn)最大的競(jìng)爭(zhēng)優(yōu)勢(shì)。這可能包括匿名的客戶數(shù)據(jù)和購買模式、客戶反饋、Web分析和供應(yīng)鏈信息。開源數(shù)據(jù)也可以是一個(gè)有用的補(bǔ)充,但是根據(jù)定義,它對(duì)每個(gè)人都可用,因此它本身不是一個(gè)區(qū)分因素。使用專有數(shù)據(jù),只要它符合隱私法規(guī),還可以減少與數(shù)據(jù)主權(quán)相關(guān)的法律復(fù)雜性。
但是,大多數(shù)組織沒有資源、財(cái)力和人力來從頭開始構(gòu)建和訓(xùn)練他們自己的領(lǐng)域特定模型。微調(diào)現(xiàn)有LLM需要大量的時(shí)間和技能,這超出了中型企業(yè)的能力,盡管它比從頭開始構(gòu)建需要更少的計(jì)算能力和數(shù)據(jù)。即時(shí)調(diào)優(yōu)和即時(shí)工程是最常見和最直接的方法。與修改模型參數(shù)相比,這些技術(shù)消耗的資源要少得多,盡管需要專業(yè)技能,但采用起來相對(duì)容易。
在現(xiàn)實(shí)世界中
一些早期使用內(nèi)部數(shù)據(jù)訓(xùn)練的LLM來自大型銀行和咨詢公司。例如,摩根士丹利公司使用即時(shí)調(diào)優(yōu)來訓(xùn)練GPT-4處理與其投資銀行業(yè)務(wù)流程相關(guān)的10萬份文件。其目的是幫助其財(cái)務(wù)顧問為客戶提供更準(zhǔn)確、更及時(shí)的建議。波士頓咨詢公司也采用了類似的方法,幫助其顧問產(chǎn)生見解和客戶建議,同時(shí)采用迭代流程,根據(jù)用戶反饋對(duì)模型進(jìn)行微調(diào)。這有助于提高產(chǎn)出,減少幻覺的機(jī)會(huì),而幻覺在面向消費(fèi)者的GPT中更為常見。
我們現(xiàn)在開始看到技術(shù)密集程度較低的服務(wù)型公司使用內(nèi)部數(shù)據(jù)定制LLM。園藝護(hù)理公司Scotts Miracle-Gro與谷歌云合作,創(chuàng)建了一個(gè)人工智能的“園藝師”,為客戶提供園藝建議和產(chǎn)品推薦。他們已經(jīng)對(duì)公司的產(chǎn)品目錄和內(nèi)部知識(shí)庫進(jìn)行了培訓(xùn),并將很快推廣到1000名現(xiàn)場(chǎng)銷售人員,幫助他們向零售和市場(chǎng)花園客戶提供價(jià)格和可用性方面的建議。預(yù)計(jì),根據(jù)結(jié)果,它將向消費(fèi)者開放,目的是推動(dòng)銷售和客戶滿意度。
就像Scotts Miracle-Gro利用人工智能為其傳統(tǒng)的銷售目錄增加價(jià)值一樣,美國(guó)大眾汽車公司的汽車手冊(cè)也是如此。這款人工智能虛擬助手接受了車輛指導(dǎo)的培訓(xùn),并輔以客戶的聯(lián)網(wǎng)汽車數(shù)據(jù),可以幫助司機(jī)更好地了解他們的車輛。這包括提供更換輪胎的指導(dǎo),以及理解儀表盤指示燈的含義。
隨著開源模型的興起,LLM在功能集和處理能力方面變得越來越商品化,從而降低了應(yīng)用程序開發(fā)人員的進(jìn)入門檻,數(shù)據(jù)將變得越來越重要。內(nèi)容所有者已經(jīng)在反對(duì)允許OpenAI和Anthropic等公司自由收集他們的數(shù)據(jù),此舉將進(jìn)一步凸顯專有信息的價(jià)值。
所有規(guī)模的公司都應(yīng)該開始更加謹(jǐn)慎地評(píng)估和保護(hù)其內(nèi)部數(shù)據(jù)資產(chǎn),并考慮如何通過人工智能來利用它來獲得競(jìng)爭(zhēng)優(yōu)勢(shì)。正如我們所看到的,即使是不起眼的產(chǎn)品目錄或用戶手冊(cè),也可以成為成熟的資產(chǎn)。