所有企業(yè)在開發(fā)AI解決方案時(shí)都應(yīng)避免的陷阱
2016年,科技巨頭微軟推出了Tay,一款旨在通過與Twitter用戶互動(dòng)來提升對話能力的聊天機(jī)器人,然而,由于Tay接收到的數(shù)據(jù),事情很快失控。在與一群Twitter用戶的互動(dòng)中,這個(gè)機(jī)器人迅速學(xué)會(huì)了種族主義和厭女言論,并將其轉(zhuǎn)化為一連串令人反感的推文。微軟在24小時(shí)內(nèi)便關(guān)閉了Tay。
這件事對那些計(jì)劃使用最新GenAI技術(shù)來深入了解業(yè)務(wù)的公司來說也是一個(gè)教訓(xùn),不論是了解薪酬水平還是識(shí)別哪些客戶有取消訂閱風(fēng)險(xiǎn)。
首先,大多數(shù)公司缺乏豐富的數(shù)據(jù)集,而AI模型需要這些數(shù)據(jù)集來提供針對其業(yè)務(wù)和行業(yè)的準(zhǔn)確且可靠的見解。
作為一家?guī)椭蛻敉诰騂R數(shù)據(jù)洞見的公司的聯(lián)合創(chuàng)始人,我親眼見證了擁有合適工具的好處。以下是為什么自行構(gòu)建解決方案比看上去要復(fù)雜得多,以及為什么合適的合作伙伴可以帶來巨大差異的原因。
何時(shí)DIY AI
假設(shè)一家公司希望開發(fā)一個(gè)AI助手,幫助解決員工薪酬公平的老問題。與其費(fèi)力地計(jì)算數(shù)字,是否不如讓AI從薪資、加薪到獎(jiǎng)金等方面提供智能建議?
雖然可以輕松獲取許多現(xiàn)成的大型語言模型(LLM)——從GPT到Gemini、Coral和Falcon——它們能夠以簡單的語言回答問題。根據(jù)用例的復(fù)雜性,成本可能每次查詢僅需幾美分。
然而,對于任何使用AI來制定薪酬決策的企業(yè)來說,模型本身是次要的。在這個(gè)例子中,重要的是讓AI深入了解薪酬的復(fù)雜性,既要考慮團(tuán)隊(duì)內(nèi)部的相對薪酬,也要參考行業(yè)中相應(yīng)技能和績效水平的標(biāo)準(zhǔn)。
為了獲得這些知識(shí),AI模型需要進(jìn)行適當(dāng)?shù)挠?xùn)練,這需要在研究上投資,向其輸入公司內(nèi)部和外部的相關(guān)數(shù)據(jù),最重要的是,加入一個(gè)人類反饋環(huán)路來驗(yàn)證和改進(jìn)結(jié)果。
這也是為什么自助式AI工具往往不可靠的主要原因之一。據(jù)一項(xiàng)調(diào)查發(fā)現(xiàn),六成自行開發(fā)AI解決方案的公司都存在準(zhǔn)確性問題。
此外,還有成本問題。盡管大型語言模型(LLM)的基本費(fèi)用相對較低,但為了適應(yīng)一家公司的特定需求而進(jìn)行訓(xùn)練卻需要大量投入。例如,據(jù)報(bào)道,Bloomberg在開發(fā)其LLM時(shí)花費(fèi)了數(shù)百萬美元,而且,維護(hù)也是一個(gè)問題。每次LLM的基礎(chǔ)版本發(fā)生變化時(shí),都必須重新訓(xùn)練以確保其一致性和可靠性。
還值得注意的是,大多數(shù)AI項(xiàng)目都會(huì)失敗,它們的失敗率可能高達(dá)80%,幾乎是內(nèi)部IT項(xiàng)目的兩倍。
如何與AI合作伙伴合作
對于大多數(shù)公司來說,更好的方法是找到一家專門為企業(yè)開發(fā)AI的合作伙伴,并且該伙伴擁有針對其行業(yè)和功能需求的大量數(shù)據(jù)集。
畢竟,只有在相關(guān)數(shù)據(jù)的基礎(chǔ)上進(jìn)行訓(xùn)練,AI對企業(yè)才有用。你用來訓(xùn)練AI的數(shù)據(jù)越多,它的價(jià)值就越大。在大多數(shù)情況下,獲得足夠的數(shù)據(jù)的唯一途徑是從許多相關(guān)企業(yè)中匯總數(shù)據(jù)。
我之前舉的薪酬例子來自HR和人力資源分析領(lǐng)域。在這里,獲取大量的員工記錄至關(guān)重要。當(dāng)我們?yōu)镠R構(gòu)建自己的AI助手時(shí),我們在來自各種行業(yè)和地區(qū)的數(shù)千萬條記錄上進(jìn)行了訓(xùn)練,這些記錄代表了極為多樣化的技能。
重要的是,這種訓(xùn)練只使用元數(shù)據(jù),即客戶的查詢記錄,而不是他們的實(shí)際數(shù)據(jù),然后,助手會(huì)根據(jù)每個(gè)客戶的需求進(jìn)行“調(diào)整”,以支持他們獨(dú)特的公司語言。提示工程在準(zhǔn)備更好的答案方面至關(guān)重要,最后,知道什么是優(yōu)質(zhì)數(shù)據(jù)也非常重要。豐富的基準(zhǔn)數(shù)據(jù)源是關(guān)鍵的先決條件。
與合適的供應(yīng)商合作意味著企業(yè)也可以確保其安全性和隱私需求得到滿足,這包括保護(hù)機(jī)密數(shù)據(jù)并為組織中的不同用戶提供訪問權(quán)限。
例如,普通員工詢問特定角色的薪酬時(shí),只能看到公司相對于行業(yè)的基準(zhǔn),而授權(quán)經(jīng)理則可以查看其直接下屬的個(gè)人薪酬詳細(xì)信息。
歸根結(jié)底,任何計(jì)劃利用AI力量的公司都必須選擇最適合其需求的方法。根據(jù)我的經(jīng)驗(yàn),找到一個(gè)擁有專門技術(shù)并且能夠訪問大量相關(guān)行業(yè)數(shù)據(jù)的合作伙伴,會(huì)取得更好的結(jié)果。單打獨(dú)斗的公司可能會(huì)給自己制造麻煩,最終無法獲得推動(dòng)競爭業(yè)務(wù)成果所需的豐富而精確的洞見。