小模型和開源正在成為AI發(fā)展的變數(shù) 原創(chuàng)
編譯丨諾亞
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
在IT行業(yè),“精益”常用來描述追求更高效率和成本效益的流程,生成式AI也不例外。一些企業(yè)的AI系統(tǒng)運(yùn)行成本高達(dá)數(shù)百萬美元,并消耗大量電力,促使企業(yè)尋求更高效、精益的AI解決方案。
企業(yè)自然傾向于借助公共云快速部署生成式AI,因其提供便捷的一站式服務(wù)。大型云服務(wù)商已從AI投資中獲益。但使用云服務(wù)的成本有時會超過傳統(tǒng)數(shù)據(jù)中心,盡管如此,企業(yè)仍在尋找有效降低成本的方法,這正是精益AI概念的意義所在。
1.精益AI是如何工作的
精益人工智能是一種戰(zhàn)略方法,強(qiáng)調(diào)在交付最大商業(yè)價值的同時注重效率、成本效益以及最小資源消耗。許多精益人工智能的方法借鑒了最初用于制造業(yè)和產(chǎn)品開發(fā)的精益管理方法。
精益人工智能側(cè)重于優(yōu)化人工智能系統(tǒng)的開發(fā)、部署和運(yùn)營。它采用較小的模型、迭代開發(fā)實踐以及資源高效的技巧來減少浪費(fèi)。通過優(yōu)先考慮敏捷的數(shù)據(jù)驅(qū)動決策制定和持續(xù)改進(jìn),精益人工智能使企業(yè)能夠以可持續(xù)且可擴(kuò)展的方式利用人工智能的力量。這確保了人工智能計劃既具有影響力又經(jīng)濟(jì)可行。
如今,企業(yè)意識到更大的并不總是更好的。企業(yè)人工智能轉(zhuǎn)型的景觀由小型語言模型(SLM)和一波開源進(jìn)展所標(biāo)志。這種演變是對生成式人工智能系統(tǒng)使用大型語言模型(LLM)所帶來的高昂成本和資源需求的一種直接回應(yīng)。許多企業(yè)現(xiàn)在希望重新評估成本與商業(yè)價值之間的平衡。
2.大型語言模型的挑戰(zhàn)
像OpenAI的GPT-4和Meta的Llama這樣的大型語言模型在理解和生成人類語言方面展示了非凡的能力。然而,這些優(yōu)勢伴隨著許多越來越難以讓企業(yè)接受的挑戰(zhàn)。這些模型的計算需求及其相應(yīng)的云成本非常高,給預(yù)算帶來壓力并限制了更廣泛的采用。還有能源消耗的問題,這不僅帶來了財務(wù)負(fù)擔(dān),也帶來了重大的環(huán)境影響。
操作延遲是另一個障礙,特別是對于需要實時響應(yīng)的應(yīng)用程序而言。我們也不應(yīng)忽視管理和維護(hù)這些龐大模型的復(fù)雜性,這些模型需要專門的專業(yè)知識和基礎(chǔ)設(shè)施,而并非所有組織都具備這些條件。
3.轉(zhuǎn)向小型語言模型
在這種背景下,小型語言模型被加速用于生成式人工智能在云端和非云端環(huán)境中的部署。它們正越來越多地被視為實用的選擇。小型語言模型旨在顯著降低計算資源需求和能源消耗。這意味著更低的運(yùn)營成本和更具吸引力的人工智能計劃投資回報率。更快的訓(xùn)練和部署周期也使得小型語言模型對那些需要在快節(jié)奏市場中保持敏捷性和響應(yīng)性的企業(yè)更具吸引力。
企業(yè)通常不會使用大型語言模型,所以建議它們這樣做是不現(xiàn)實的。相反,它們將構(gòu)建更有針對性的人工智能系統(tǒng)來解決特定的應(yīng)用場景,例如設(shè)備維護(hù)、運(yùn)輸物流和制造優(yōu)化等領(lǐng)域,在這些領(lǐng)域中,精益人工智能方法可以立即產(chǎn)生商業(yè)價值。
小型語言模型還加強(qiáng)了定制化。這些模型可以針對具體任務(wù)和行業(yè)領(lǐng)域進(jìn)行精細(xì)調(diào)整,產(chǎn)生專業(yè)應(yīng)用并產(chǎn)生可衡量的商業(yè)成果。無論是在客戶服務(wù)、金融分析還是醫(yī)療診斷領(lǐng)域,這些更精簡的模型都證明了自己的有效性。
4.開源的優(yōu)勢
開源社區(qū)一直是推動小型語言模型進(jìn)步和采用的驅(qū)動力。Meta的新版本Llama 3.1提供了多種大小選項,能夠在不過度消耗資源的情況下提供強(qiáng)大的能力。其他模型,如斯坦福大學(xué)的Alpaca和Stability AI的StableLM,表明小型模型的表現(xiàn)可以媲美甚至超越其大型對手,尤其是在特定領(lǐng)域的應(yīng)用中。
來自Hugging Face、IBM的Watsonx.ai等公司的云平臺和工具使得這些模型更容易獲取,并降低了各類企業(yè)的入門門檻。這種人工智能能力的民主化是一個游戲規(guī)則改變者。更多的組織可以在不依賴專有且往往價格昂貴的解決方案的情況下融入先進(jìn)的人工智能技術(shù)。
5.企業(yè)的轉(zhuǎn)變
采用小型語言模型對企業(yè)來說有多重好處:
- 成本效益:這些模型讓企業(yè)能以更低的成本部署人工智能,這對需要最大化技術(shù)投資的初創(chuàng)公司和中小企業(yè)尤為重要。
- 敏捷性提升:更快的部署速度和更靈活的定制能力確保AI功能更好地適應(yīng)不斷變化的業(yè)務(wù)需求。
- 數(shù)據(jù)隱私與主權(quán):在本地或私有云部署小型模型可以更好地保護(hù)數(shù)據(jù)隱私,滿足監(jiān)管要求并確保數(shù)據(jù)安全。
- 可持續(xù)發(fā)展:較低的能源消耗支持企業(yè)的環(huán)保目標(biāo)。
借助開源創(chuàng)新,小型語言模型降低了大型AI系統(tǒng)的成本和復(fù)雜度,為企業(yè)提供了高效、可定制的路徑。這種轉(zhuǎn)變提高了AI投資的價值,并促進(jìn)了可持續(xù)且可擴(kuò)展的增長。在可持續(xù)且經(jīng)濟(jì)實惠的人工智能領(lǐng)域,小型模型正變得越來越重要。
參考鏈接:https://www.infoworld.com/article/3480593/small-language-models-and-open-source-are-transforming-ai.html
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:諾亞
