企業(yè)為何紛紛轉(zhuǎn)向小AI模型?
當(dāng)科技巨頭們還在比拼千億參數(shù)時(shí),一場靜悄悄的AI效率革命正在改寫商業(yè)規(guī)則,從醫(yī)療診斷到零售庫存管理,企業(yè)開始用“小模型”解決“大問題”。
大型語言模型因其多功能性、廣泛的領(lǐng)域知識和解決復(fù)雜多步驟問題的能力而廣受歡迎。相比之下,小型模型為企業(yè)提供了一種資源消耗更少的方式,能夠利用定制化的專業(yè)知識完成特定任務(wù)。
分析師告訴記者,雖然過去幾年大型語言模型在企業(yè)中更為普遍,但輕量級模型已逐漸受到關(guān)注,并且其商業(yè)應(yīng)用預(yù)計(jì)今年將進(jìn)一步增加。
“代理模型和推理模型將是主要話題……但小型語言模型是整體商業(yè)價(jià)值討論中的重要部分。”Gartner杰出副總裁分析師Arun Chandrasekaran表示。
對于小型AI模型的定義,眾說紛紜。一些人根據(jù)參數(shù)數(shù)量來定義小型語言模型,其參數(shù)數(shù)量通常在數(shù)千萬至數(shù)十億之間,而大型語言模型的參數(shù)數(shù)量則達(dá)到數(shù)百億或數(shù)千億。
“我認(rèn)為,理想的參數(shù)范圍在10億至100億之間,”Chandrasekaran說?!霸谶^去6到12個(gè)月里,至少50%的企業(yè)已經(jīng)積極研究了參數(shù)范圍在10億至100億之間的模型,以用于其應(yīng)用場景。”
其他人則更少地基于模型大小來定義小型模型,而更多地關(guān)注開發(fā)方法,如通過蒸餾法。Forrester預(yù)測,隨著擁有行業(yè)特定術(shù)語的企業(yè)尋求利用具有特定領(lǐng)域?qū)I(yè)知識的模型,這種小型語言模型的集成今年將激增60%以上。
不同的定義可能會讓CIO和采購團(tuán)隊(duì)感到困惑。
“小型語言模型并沒有任意的規(guī)模界限,這確實(shí)使得這個(gè)領(lǐng)域非常令人困惑?!盕orrester高級分析師Rowan Curran表示。
小型AI模型的供應(yīng)商選項(xiàng)眾多。谷歌的輕量級Gemma模型系列已推出近一年。微軟推出了一系列名為Phi的小型模型,其中最新的Phi-4于去年12月向客戶推出。OpenAI在1月底發(fā)布了o3-mini,此前該初創(chuàng)公司已于去年夏天推出了GPT-4o mini。
“構(gòu)建大型模型的公司也在構(gòu)建小型模型?!盋handrasekaran說。
企業(yè)的吸引力
小型AI模型與其大型同類模型一樣,既有優(yōu)勢也有局限。
Curran表示,具有專業(yè)術(shù)語的行業(yè)和企業(yè),如醫(yī)療保健或醫(yī)療器械零售商,是小型模型發(fā)展的理想領(lǐng)域。Forrester發(fā)現(xiàn),約三分之一的技術(shù)決策者在購買時(shí)優(yōu)先考慮特定領(lǐng)域的GenAI能力。
小型模型通常使用較少的計(jì)算能力,從而降低了資源緊張企業(yè)的成本。由于預(yù)算限制、技能差距和計(jì)算能力可用性,超過三分之一的公司已將AI項(xiàng)目推遲了三個(gè)月至半年。
小型模型在設(shè)備端、本地和云端都具有成本效益。例如,OpenAI表示,其GPT-4o mini的成本比GPT-3.5 Turbo低60%以上。在本地或私有云部署上運(yùn)行的小型模型還可以緩解CIO對安全和隱私的擔(dān)憂。
聯(lián)合國教科文組織等組織已推廣小型模型作為更環(huán)保的計(jì)算替代方案。
盡管人們希望GenAI最終能推動企業(yè)更接近可持續(xù)發(fā)展目標(biāo),但企業(yè)在控制支持AI計(jì)劃所需資源方面一直面臨挑戰(zhàn)。根據(jù)谷歌的年度報(bào)告,隨著計(jì)算強(qiáng)度和技術(shù)基礎(chǔ)設(shè)施投資的增加,其溫室氣體排放量去年也有所上升,自2019年以來增長了48%。
Constellation Research的副總裁兼首席分析師Andy Thurai表示,雖然小型模型有其優(yōu)勢,但它們并非所有用例的最佳選擇。