AI大模型非常昂貴 只有大企業(yè)和超級富豪才能玩得轉(zhuǎn)
ChatGPT大火帶動(dòng)AI又一波熱潮,不過業(yè)界普遍認(rèn)為,當(dāng)AI 步入大模型時(shí)代,只有大企業(yè)和超級富有的企業(yè)才玩得起AI,因?yàn)锳I大模型的打造非常昂貴。
首先是計(jì)算昂貴。多倫多大學(xué)市場營銷教授Avi Goldfarb說:“如果你想創(chuàng)辦一家企業(yè),自己開發(fā)大語言模型,自己計(jì)算,成本太高了。OpenAI是很貴的,要數(shù)以十億計(jì)的美元?!弊赓U計(jì)算當(dāng)然會(huì)便宜不少,但企業(yè)仍然要向AWS等企業(yè)支付昂貴費(fèi)用。
其次是數(shù)據(jù)昂貴。訓(xùn)練模型需要海量數(shù)據(jù),有時(shí)數(shù)據(jù)是現(xiàn)成的,有時(shí)不是。Common Crawl和LAION等數(shù)據(jù)可以免費(fèi)使用,對于此類數(shù)據(jù),成本主要來自數(shù)據(jù)清理和處理,成本變化很大,可能是幾百美元,也可能是幾百萬美元。
Glean公司創(chuàng)始工程師Debarghya Das說,在美國,根據(jù)大語言模型論文做一些粗略的數(shù)學(xué)計(jì)算,如果用的是Facebook LLaMA,訓(xùn)練成本(不考慮迭代或者出錯(cuò))大約是400萬美元,如果是谷歌PaLM,大約2700萬美元。
即使用的是免費(fèi)數(shù)據(jù),成本也不低。Hugging Face公司研究人員Sasha Luccioni說:“當(dāng)你下載容量達(dá)到TB的數(shù)據(jù),如果想過濾或者以某種特殊方式利用數(shù)據(jù),比如用文本-圖片模型處理(研究人會(huì)專注于某些數(shù)據(jù)子集,這樣模型才會(huì)變得更好),整個(gè)過程相當(dāng)棘手?!毙枰獜?qiáng)大的計(jì)算力,需要大量專業(yè)人士。
再次,專業(yè)人才的聘請費(fèi)用也很高。Debarghya Das在做上述估算成本時(shí)沒有考慮人力成本。Sasha Luccioni指出:“機(jī)器學(xué)習(xí)專業(yè)人士的薪酬很高,因?yàn)橐c谷歌及其它科技巨頭爭奪人才,有時(shí)一位專業(yè)人才可能要幾百萬美元?!?016年OpenAI最頂級的研究人員薪酬約為190萬美元。
并且,訓(xùn)練模型、聘請專業(yè)人士的成本不是一次性的,是持續(xù)的。例如,如果開發(fā)的是客服聊天機(jī)器人,每周或者每幾周就要優(yōu)化。模型還要經(jīng)受壓力測試,確保它生成的答案不出錯(cuò)。正如Sasha Luccioni所解釋:“最貴的成本來自持續(xù)性工作,必須持續(xù)測試模型,必須確保AI所做的和預(yù)期一樣。”
最后,持續(xù)運(yùn)轉(zhuǎn)費(fèi)用也不低。當(dāng)一切準(zhǔn)備妥當(dāng),模型向公眾開放,每天要接受成千上萬次詢問,此時(shí)要確保模型可擴(kuò)展、高度穩(wěn)定,維護(hù)成本也很高,且需要專業(yè)人士來處理。