譯者 | 布加迪
審校 | 重樓
LLM正在推動(dòng)各行各業(yè)的突破和效率。在選擇一種模型時(shí),企業(yè)應(yīng)該考慮預(yù)期的應(yīng)用、速度、安全、成本、語(yǔ)言和易用性。
雖然與其他人工智能(AI)技術(shù)相比,生成式AI比較新,但它已經(jīng)被用于支持從審查求職者到診斷和推薦疾病治療的一系列任務(wù)。IDC預(yù)測(cè),到2028年,80%的首席信息官將依靠生成式AI工具來(lái)加快分析、促進(jìn)決策和改善客戶服務(wù)等。
企業(yè)正在競(jìng)相挖掘這項(xiàng)技術(shù)的潛力,以提高客戶滿意度和員工生產(chǎn)力。為此,它們正在考慮使用最適合支持生成式AI應(yīng)用的大語(yǔ)言模型(LLM),比如AI copilot和聊天機(jī)器人。
了解LLM的多樣性
如今市面上有大量的LLM可供選擇,這意味著企業(yè)更有可能找到適合自己特定需求的LLM,而不是求助于一應(yīng)俱全的LLM。這可以加速創(chuàng)新,不過從數(shù)百種模型中選擇合適的模型可能很復(fù)雜。
在選擇LLM時(shí),企業(yè)應(yīng)該考慮其預(yù)期的應(yīng)用、速度、安全、成本、語(yǔ)言和易用性。
模型類型包括:
- 商業(yè)模型:在醫(yī)療保健和金融服務(wù)行業(yè)很流行,這類模型通常用于涉及專門定制或安全限制的項(xiàng)目。
- 開源模型:由于可訪問性和成本優(yōu)勢(shì),這類模型經(jīng)常被初創(chuàng)公司和小企業(yè)用于研究。
- 通用模型:這類模型使用大量數(shù)據(jù)加以訓(xùn)練,可以用作構(gòu)建定制AI應(yīng)用程序的基礎(chǔ)模型。
- 針對(duì)特定領(lǐng)域的模型:這類模型經(jīng)過訓(xùn)練以適應(yīng)特定的行業(yè)或用例,比如醫(yī)療保健或金融服務(wù)。
- 針對(duì)特定任務(wù)的模型:這類度身定制的模型針對(duì)單一自然語(yǔ)言處理(NLP)功能進(jìn)行了優(yōu)化,比如摘要、答題或翻譯。
- 視覺語(yǔ)言模型:這類模型被稱為VLM,結(jié)合了計(jì)算機(jī)視覺和NLP,從文本描述中生成圖像,并從圖像中識(shí)別物體。同時(shí)使用文本和代碼讓它們可以在不直接使用視覺數(shù)據(jù)訓(xùn)練的情況下創(chuàng)建和理解圖像。
考慮模型的大小也很重要,因?yàn)檫@將影響其功能和局限性。一些因素包括如下:
- 推理速度:較小的模型通常提供較短的推理時(shí)間,實(shí)現(xiàn)實(shí)時(shí)處理,提高能效并節(jié)省成本。
- 準(zhǔn)確性:使用檢索增強(qiáng)生成(RAG)改善的大型模型常常會(huì)獲得更高的準(zhǔn)確性。
- 可部署性:較小的模型非常適合邊緣設(shè)備和移動(dòng)應(yīng)用程序,而較大的模型最好在云端或數(shù)據(jù)中心運(yùn)行。
- 成本:較大的模型需要更多的計(jì)算基礎(chǔ)設(shè)施來(lái)運(yùn)行。
開發(fā)者還應(yīng)該基于誰(shuí)將使用AI模型、應(yīng)用于何處,考慮AI模型必須支持哪些語(yǔ)言。這在現(xiàn)代工作場(chǎng)所顯得尤為重要,因?yàn)閱T工可能說(shuō)多種不同的語(yǔ)言。確保模型能夠無(wú)縫翻譯語(yǔ)言對(duì)于用戶之間的有效溝通和協(xié)作至關(guān)重要。
此外,隨著主權(quán)AI越來(lái)越重要,許多國(guó)家正在構(gòu)建使用當(dāng)?shù)卣Z(yǔ)言和數(shù)據(jù)集訓(xùn)練的專有模型。這使各國(guó)能夠?qū)I保持控制權(quán)和自主權(quán),確保這些技術(shù)的開發(fā)和應(yīng)用符合其獨(dú)特的文化、道德和法律標(biāo)準(zhǔn)。
企業(yè)如何使用LLM?
LLM支持各種AI應(yīng)用,包括聊天機(jī)器人和預(yù)測(cè)分析工具,這些應(yīng)用正在各行各業(yè)帶來(lái)突破和效率。
- 醫(yī)療保健業(yè):Insilico Medicine是一家基于生成式AI的藥物發(fā)現(xiàn)公司,它開發(fā)了一種新的LLM轉(zhuǎn)換器:nach0,用于回答生物醫(yī)學(xué)問題,并合成新分子。這種多領(lǐng)域模型使研究人員能夠高效地處理和分析大型數(shù)據(jù)集,減少內(nèi)存需求,提高處理速度,促進(jìn)更有效的數(shù)據(jù)管理和組織。
- 電信業(yè):Amdocs正在使用其amAIz平臺(tái)來(lái)提高業(yè)務(wù)效率,推動(dòng)新的收入流,并改善客戶體驗(yàn)。這包括一款客戶計(jì)費(fèi)代理,便于用戶立即享用基于LLM的數(shù)據(jù)洞察和自動(dòng)化,以解決客戶計(jì)費(fèi)問題。
- 金融服務(wù)業(yè):Bank Negara(又名BNI)正在整合Cloudera的AI Inference服務(wù),以便使用生成式AI增強(qiáng)客戶體驗(yàn),并提高運(yùn)營(yíng)效率。這將使BNI能夠在安全的企業(yè)環(huán)境中有效地部署和管理大規(guī)模AI模型,并提供高性能和數(shù)據(jù)隱私。
針對(duì)特定需求量身定制的不同模型允許快速實(shí)施AI解決方案和工具,以幫助自動(dòng)處理冗余工作。這為人們騰出了更多的時(shí)間和空間,以便專注于對(duì)公司和組織帶來(lái)價(jià)值的項(xiàng)目。
展望未來(lái),開發(fā)者將竭力構(gòu)建和部署能夠增強(qiáng)行業(yè)特定應(yīng)用的LLM,致力于改善系統(tǒng)之間的互操作性,降低運(yùn)營(yíng)成本,并提高效率。使用量身定制的LLM,企業(yè)可以構(gòu)建滿足其獨(dú)特需求的AI應(yīng)用程序,以提高客戶滿意度,并促進(jìn)卓越運(yùn)營(yíng)。
原文標(biāo)題:Finding the right large language model for your needs,作者:Amanda Saunders