自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

企業(yè)為何紛紛轉(zhuǎn)向小AI模型?

人工智能
大型語言模型因其多功能性、廣泛的領(lǐng)域知識和解決復(fù)雜多步驟問題的能力而廣受歡迎。相比之下,小型模型為企業(yè)提供了一種資源消耗更少的方式,能夠利用定制化的專業(yè)知識完成特定任務(wù)。

當(dāng)科技巨頭們還在比拼千億參數(shù)時(shí),一場靜悄悄的AI效率革命正在改寫商業(yè)規(guī)則,從醫(yī)療診斷到零售庫存管理,企業(yè)開始用“小模型”解決“大問題”。

大型語言模型因其多功能性、廣泛的領(lǐng)域知識和解決復(fù)雜多步驟問題的能力而廣受歡迎。相比之下,小型模型為企業(yè)提供了一種資源消耗更少的方式,能夠利用定制化的專業(yè)知識完成特定任務(wù)。

分析師告訴記者,雖然過去幾年大型語言模型在企業(yè)中更為普遍,但輕量級模型已逐漸受到關(guān)注,并且其商業(yè)應(yīng)用預(yù)計(jì)今年將進(jìn)一步增加。

“代理模型和推理模型將是主要話題……但小型語言模型是整體商業(yè)價(jià)值討論中的重要部分。”Gartner杰出副總裁分析師Arun Chandrasekaran表示。

對于小型AI模型的定義,眾說紛紜。一些人根據(jù)參數(shù)數(shù)量來定義小型語言模型,其參數(shù)數(shù)量通常在數(shù)千萬至數(shù)十億之間,而大型語言模型的參數(shù)數(shù)量則達(dá)到數(shù)百億或數(shù)千億。

“我認(rèn)為,理想的參數(shù)范圍在10億至100億之間,”Chandrasekaran說?!霸谶^去6到12個(gè)月里,至少50%的企業(yè)已經(jīng)積極研究了參數(shù)范圍在10億至100億之間的模型,以用于其應(yīng)用場景。”

其他人則更少地基于模型大小來定義小型模型,而更多地關(guān)注開發(fā)方法,如通過蒸餾法。Forrester預(yù)測,隨著擁有行業(yè)特定術(shù)語的企業(yè)尋求利用具有特定領(lǐng)域?qū)I(yè)知識的模型,這種小型語言模型的集成今年將激增60%以上。

不同的定義可能會讓CIO和采購團(tuán)隊(duì)感到困惑。

“小型語言模型并沒有任意的規(guī)模界限,這確實(shí)使得這個(gè)領(lǐng)域非常令人困惑?!盕orrester高級分析師Rowan Curran表示。

小型AI模型的供應(yīng)商選項(xiàng)眾多。谷歌的輕量級Gemma模型系列已推出近一年。微軟推出了一系列名為Phi的小型模型,其中最新的Phi-4于去年12月向客戶推出。OpenAI在1月底發(fā)布了o3-mini,此前該初創(chuàng)公司已于去年夏天推出了GPT-4o mini。

“構(gòu)建大型模型的公司也在構(gòu)建小型模型?!盋handrasekaran說。

企業(yè)的吸引力

小型AI模型與其大型同類模型一樣,既有優(yōu)勢也有局限。

Curran表示,具有專業(yè)術(shù)語的行業(yè)和企業(yè),如醫(yī)療保健或醫(yī)療器械零售商,是小型模型發(fā)展的理想領(lǐng)域。Forrester發(fā)現(xiàn),約三分之一的技術(shù)決策者在購買時(shí)優(yōu)先考慮特定領(lǐng)域的GenAI能力。

小型模型通常使用較少的計(jì)算能力,從而降低了資源緊張企業(yè)的成本。由于預(yù)算限制、技能差距和計(jì)算能力可用性,超過三分之一的公司已將AI項(xiàng)目推遲了三個(gè)月至半年。

小型模型在設(shè)備端、本地和云端都具有成本效益。例如,OpenAI表示,其GPT-4o mini的成本比GPT-3.5 Turbo低60%以上。在本地或私有云部署上運(yùn)行的小型模型還可以緩解CIO對安全和隱私的擔(dān)憂。

聯(lián)合國教科文組織等組織已推廣小型模型作為更環(huán)保的計(jì)算替代方案。

盡管人們希望GenAI最終能推動企業(yè)更接近可持續(xù)發(fā)展目標(biāo),但企業(yè)在控制支持AI計(jì)劃所需資源方面一直面臨挑戰(zhàn)。根據(jù)谷歌的年度報(bào)告,隨著計(jì)算強(qiáng)度和技術(shù)基礎(chǔ)設(shè)施投資的增加,其溫室氣體排放量去年也有所上升,自2019年以來增長了48%。

Constellation Research的副總裁兼首席分析師Andy Thurai表示,雖然小型模型有其優(yōu)勢,但它們并非所有用例的最佳選擇。

責(zé)任編輯:姜華 來源: 企業(yè)網(wǎng)D1Net
相關(guān)推薦

2023-04-13 22:04:16

AI人工智能

2013-11-11 13:35:44

虛擬化應(yīng)用

2024-11-21 17:35:10

2024-10-25 16:45:02

2021-07-27 12:48:42

AI馬斯克人工智能

2021-11-25 13:12:12

Mobileye英特爾寶馬

2023-07-04 15:58:11

ChatGPT人工智能

2024-05-27 08:00:00

人工智能大語言模型

2012-05-11 10:54:58

基礎(chǔ)設(shè)施云服務(wù)PaaS

2015-06-02 16:10:37

云計(jì)算CDN市場

2021-09-03 15:16:48

芯片谷歌蘋果

2018-05-07 11:26:01

2021-05-08 13:57:43

云安全云計(jì)算網(wǎng)絡(luò)安全

2009-04-09 18:53:23

Vmware虛擬化

2013-02-19 14:58:50

MozillaWebKit

2018-04-26 15:25:20

AIIT運(yùn)維企業(yè)上云

2012-05-28 17:34:38

瀏覽器互聯(lián)網(wǎng)

2012-07-25 15:20:24

JS

2020-06-28 09:44:09

云計(jì)算公有云數(shù)據(jù)

2022-05-06 15:46:16

區(qū)塊鏈Web3奢侈品
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號