大模型燒錢戰(zhàn)“卷”出白菜價(jià),李開復(fù)、王小川為何拒絕入局? 原創(chuàng)
撰稿丨今日晴
出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
暗流涌動(dòng)的大模型圈,幾乎毫無征兆地開啟了價(jià)格戰(zhàn)。
近一周時(shí)間,字節(jié)跳動(dòng)、阿里巴巴、百度、騰訊等多家廠商紛紛調(diào)整旗下大模型產(chǎn)品的定價(jià)策略,宣布面向企業(yè)市場的API價(jià)格下調(diào),動(dòng)輒下調(diào)90%以上,更有甚者直接宣布免費(fèi)。
值得注意的是,在這場硝煙彌漫的肉搏戰(zhàn)里,主力多是云巨頭,他們所售賣的模型服務(wù)往往是與云服務(wù)緊密綁定的。而大模型初創(chuàng)公司卻頂住了壓力,普遍并未有太多動(dòng)作。零一萬物的創(chuàng)始人李開復(fù)直接對(duì)外表示,瘋狂降價(jià)是雙輸;百川智能的創(chuàng)始人王小川也回應(yīng):百川不會(huì)摻和到價(jià)格戰(zhàn)當(dāng)中。
1.字節(jié)打響大模型降價(jià)第一槍
5月15日,字節(jié)跳動(dòng)豆包大模型率先打響第一槍,宣布主流大模型在企業(yè)市場的定價(jià)為0.0008元/千Tokens,0.8厘就能處理1500多個(gè)漢字,比行業(yè)便宜99.3%。這一招徹底推動(dòng)大模型從“以分計(jì)價(jià)”進(jìn)入到了“以厘計(jì)價(jià)”階段,并聲稱已經(jīng)擊穿了大模型行業(yè)的最底價(jià),堪稱“價(jià)格屠夫”。
不過,超低的定價(jià)并不代表實(shí)際使用的價(jià)格。從豆包大模型的官網(wǎng)價(jià)格頁來看,128k模型的0.0008元/千Tokens定價(jià)實(shí)際為模型推理服務(wù)的輸入價(jià)格,還需要為模型的輸出價(jià)格付費(fèi)0.002元/千tokens。
圖片
另外,價(jià)格單中展示的價(jià)格為“后付費(fèi)”模式,指企業(yè)先消耗tokens,然后為其買單。但對(duì)于模型的高并發(fā)、穩(wěn)定性有更高要求的用戶,還需要采用“預(yù)付費(fèi)”的模式,獲得模型廠商的服務(wù)保障,這也會(huì)導(dǎo)致實(shí)際的使用價(jià)格比展示的定價(jià)更貴一些。
圖片
即便如此,大模型的降價(jià)潮已成定勢(shì)。
有業(yè)內(nèi)人士分析,一些大模型以開源模型為基座,本來成本就低,所以本身還存在降價(jià)空間;亦有分析認(rèn)為,大模型降價(jià)主要是為了快速搶占市場,普惠市場才能真正提升使用量,才能更好地打磨出好模型,讓生態(tài)更完善。
不管實(shí)際情況如何,大家心知肚明的一點(diǎn)是,“只要有一家較大的廠商開始降價(jià),其他廠商也會(huì)基于壓力開始跟隨,要不然就可能掉隊(duì)?!?/p>
2.四巨頭緊隨其后
果不其然。
21日,阿里云發(fā)布降價(jià)公告,通義千問9款模型齊降價(jià)。其中,對(duì)標(biāo)GPT-4的商業(yè)化模型Qwen-Long的API輸入價(jià)格從0.02元/千Tokens降至0.0005元/千Tokens,直降97%;輸出價(jià)格降至0.002元/千Tokens,比原來定價(jià)直降90%。阿里的這一輪操作力度,被視作對(duì)市場的又一大沖擊。
圖片
同樣在21日,百度智能云緊隨其后,宣布文心大模型兩大主力模型ERNIE Speed、ERNIE Lite全面免費(fèi),立即生效。據(jù)百度有關(guān)負(fù)責(zé)人介紹,這兩款模型于今年3月推出,支持128k、8k上下文長度,是目前百度文心大模型系列中服務(wù)用戶最多的模型型號(hào)。
22日,騰訊云也放出殺招,宣布多款混元模型免費(fèi)或降價(jià)。其中混元-lite模型免費(fèi),混元-standard-256k輸入價(jià)格下調(diào)87.5%至0.015元/千tokens,輸出價(jià)格下降50%至0.06元/千tokens。萬億參數(shù)模型混元-pro,API輸入價(jià)格則從0.1元/千tokens降至0.03元/千tokens。與此同時(shí),騰訊云正式對(duì)外宣布旗下AI代碼助手全面對(duì)外開放,目前開發(fā)者、開發(fā)團(tuán)隊(duì)、企業(yè)客戶可以通過騰訊云官網(wǎng)在線體驗(yàn)。
圖片
同在22日,科大訊飛宣布旗下大模型訊飛星火API能力正式免費(fèi)開放。其中,訊飛星火Lite API永久免費(fèi)開放,訊飛星火Pro/Max API低至0.21元/萬tokens。科大訊飛表示,在訊飛星火,1Token相當(dāng)于1.5個(gè)中文漢字,因此2.1元就足夠調(diào)用“訊飛星火3.5 Max”生成一部余華《活著》的內(nèi)容量。
另外放眼國外的話,其實(shí)還可以發(fā)現(xiàn),自去年以來,OpenAI已經(jīng)進(jìn)行了多次降價(jià),13日,OpenAI發(fā)布GPT-4o,表示面向ChatGPT的所有付費(fèi)和免費(fèi)用戶發(fā)布,取消其他所有限制,API價(jià)格也降價(jià)50%。
3.最便宜的不一定能贏得商戰(zhàn)
面對(duì)大模型近乎白菜價(jià)的甩賣,各方人士對(duì)于其直接作用和后續(xù)影響有著不同看法。
有人說,價(jià)格戰(zhàn)實(shí)際是大模型產(chǎn)品同質(zhì)化加劇的惡果,降價(jià)成為了爭奪市場份額的最直接的獲客策略。不過也有人認(rèn)為,大模型價(jià)格戰(zhàn)并非盲目以虧損換流量,有技術(shù)進(jìn)步作為控制成本的底氣,以此鼓勵(lì)用戶在更多場景探索落地,先把應(yīng)用場景鋪開再談其他。
火山引擎總裁譚待在接受媒體采訪時(shí)曾表示,“用虧損換收入是不可持續(xù)的,所以豆包大模型從來不走這條路。至于為什么可以這樣降價(jià),因?yàn)槲覀冇泻芏嗍侄伟殉杀咀龅煤芎谩4蟮氖褂昧?,才能打磨出好模型,也能大幅降低模型推理的單位成本?!?/p>
百川智能CEO王小川也對(duì)“降價(jià)戰(zhàn)”發(fā)表了自己的看法。與移動(dòng)時(shí)代的燒錢不同,王小川認(rèn)為降價(jià)是技術(shù)進(jìn)步的結(jié)果?!按髲S也預(yù)期未來模型的成本會(huì)降低特別多,也許今天虧錢,再過一年就不虧錢。我覺得大家對(duì)模型降價(jià)本身也有推理成本的降低的預(yù)期,就是因?yàn)榧夹g(shù)進(jìn)步?!?/p>
不過,也有人覺得降價(jià)策略并不會(huì)對(duì)商業(yè)化造成實(shí)質(zhì)性影響。
Lepton AI 創(chuàng)始人、阿里巴巴原副總裁賈揚(yáng)清認(rèn)為,企業(yè)在使用AI的時(shí)候,并不是成本驅(qū)動(dòng)。不是因?yàn)锳PI貴才沒人用,而是因?yàn)槠髽I(yè)首先得搞清楚怎么用來產(chǎn)生業(yè)務(wù)價(jià)值?!耙苍S不是最便宜的贏得商戰(zhàn),而是能落地的贏得利潤?!?/p>
選擇使用大模型產(chǎn)品到底能給其業(yè)務(wù)帶來多少增長,才是企業(yè)用戶最為關(guān)心的。
獵豹移動(dòng)董事長兼CEO傅盛直言,“這次大降價(jià)基本宣告了大模型創(chuàng)業(yè)公司必須尋找新的商業(yè)模式。短期來看,大模型的性能遇到了瓶頸,誰也甩不開誰,誰也拿不出殺手锏,降低推理成本,降低售價(jià)成了現(xiàn)在每一家的高優(yōu)先級(jí)任務(wù)。“
他表示,本輪AI大模型降價(jià)的目標(biāo)不是為了用戶更多的直接使用,而是為了吸引開發(fā)者。這輪降價(jià)對(duì)企業(yè)用戶影響有限。因?yàn)槠髽I(yè)用戶需要A1應(yīng)用,更關(guān)心數(shù)據(jù)安全?,F(xiàn)在開源小參數(shù)大模型加應(yīng)用套件,可以滿足絕大多數(shù)的企業(yè)需求了,但套件定制的費(fèi)用誰也省不掉,私有化大模型的成本已經(jīng)很低。
4.創(chuàng)業(yè)公司的另一種選擇:不卷價(jià)格,卷性能
巨頭們跟進(jìn)大模型價(jià)格戰(zhàn)步履匆匆,但大模型創(chuàng)業(yè)公司對(duì)此態(tài)度不一。大模型“五小龍”之中,除了智譜AI已在此前宣布降價(jià)以外,其余幾家目前尚未對(duì)價(jià)格進(jìn)行調(diào)整。李開復(fù)和王小川均于近日進(jìn)行了回應(yīng),表示不會(huì)跟進(jìn)降價(jià)。
這幾家創(chuàng)業(yè)公司的掌舵人似乎都傾向于:不盲目卷入價(jià)格戰(zhàn),而是要堅(jiān)持在自身的模型性能上發(fā)力。
李開復(fù)近期在一次訪談中表示,對(duì)于降價(jià)這個(gè)現(xiàn)象值得關(guān)注,零一萬物也在花很大精力希望能夠讓它再降下來,并預(yù)計(jì)整個(gè)行業(yè)每年降低10倍推理成本是可以期待的。但李開復(fù)明確在大模型領(lǐng)域,自己不會(huì)玩“ofo”瘋狂降價(jià)模式的打法,“因?yàn)榧夹g(shù)還是最重要的,如果是技術(shù)不行,就純粹靠貼錢賠錢去做生意,我們絕對(duì)不會(huì)跟這樣的一個(gè)定價(jià)來做對(duì)標(biāo),我們對(duì)自己的模型表現(xiàn)是非常自豪的?!?/p>
李開復(fù)透露,零一萬物選擇了一條“高精尖”路線,“對(duì)要求最高的,需求最高的,需要最好模型的,他們當(dāng)然用我們。100萬個(gè)token花十幾塊還是花幾塊錢有很大差別嗎?”
王小川對(duì)于價(jià)格戰(zhàn)的看法也有其自身的理解。他判斷,這一輪大廠降價(jià)的實(shí)質(zhì)是云廠商進(jìn)到新戰(zhàn)場,降價(jià)不僅是這些大廠射程范圍內(nèi)的事,也是僅限于云廠商的動(dòng)作。如果是針對(duì)企業(yè)端服務(wù),這場戰(zhàn)爭最后也會(huì)變成售賣整套云服務(wù)而不是模型本身。這很像曾經(jīng)發(fā)生在“AI四小龍”身上的故事。王小川稱自己并未因眼前正在發(fā)生的爭端而產(chǎn)生任何焦慮,但他建議創(chuàng)業(yè)公司不要摻和進(jìn)去。
另一個(gè)有趣的現(xiàn)象,與愈演愈烈的降價(jià)大潮形成鮮明對(duì)比的是,就在前幾天,主打免費(fèi)的月之暗面開始試探讓用戶付費(fèi)的可能,一些使用Kimi的重度用戶在高峰時(shí)段Kimi因?yàn)樗懔Σ蛔?,彈出一個(gè)對(duì)話框表示:“急需Kimi?‘點(diǎn)擊這里’給Kimi加油,高峰時(shí)期優(yōu)先使用?!?/p>
用戶在點(diǎn)擊鏈接后會(huì)彈出一個(gè)新的頁面,上面是包含不同價(jià)格和對(duì)應(yīng)時(shí)長的“打賞方案”,包括5.2元/4天,9.99元/8天,28.8元/23天,49.9元/40天,99元/93天,399元/365天。
這些充值方案對(duì)應(yīng)的打賞話術(shù)也比較有趣,相較普通產(chǎn)品更貼近用戶生活,強(qiáng)調(diào)交互感。它寫的是“送Kimi一朵花”、“給Kimi加雞腿”,以及請(qǐng)喝咖啡、充充電、請(qǐng)吃頓飯和一起登月。除了“登月”,這些場景描述對(duì)應(yīng)的消費(fèi)與方案價(jià)格相匹配。
對(duì)話頁面下方的《Kimi支付協(xié)議》解釋道,在高峰時(shí)段Kimi算力不足時(shí),產(chǎn)品將在Kimi實(shí)際可調(diào)用的推理算力范圍內(nèi),優(yōu)先保障獲得服務(wù)用戶的推理算力。這個(gè)思路有點(diǎn)像B端用戶的“預(yù)付費(fèi)”邏輯。
圖片
5.寫在最后
大模型賽道的戰(zhàn)火延綿至今,已經(jīng)過去一年有余,大模型廠商作為掌握這項(xiàng)魔法的基建提供方,似乎正在來到新的賽點(diǎn)。移動(dòng)時(shí)代的阿里、字節(jié)、百度、騰訊等當(dāng)然熟悉那個(gè)年代的商戰(zhàn)存活規(guī)則,不過大模型時(shí)代之下,似乎“燒錢”模式并非適用于今天的生長環(huán)境。我們也有理由相信,這波降價(jià)背后,離不開推理技術(shù)的進(jìn)步。
此番降價(jià)大戰(zhàn),表面上看著實(shí)類似當(dāng)年的瘋狂爭搶用戶規(guī)模的打法,但熱衷于為企業(yè)內(nèi)部部署大模型的決策者們究竟會(huì)因?yàn)椤癆PI降價(jià)甚至免費(fèi)”而采取更激進(jìn)的決定嗎?
未必,大模型遠(yuǎn)不止是成本的問題,技術(shù)、成本、市場、需求、安全,一個(gè)都不能少。而且在大模型賽道上,大廠有大廠的路徑,創(chuàng)業(yè)公司有創(chuàng)業(yè)公司的堅(jiān)持?;蛟S降低成本是加速驗(yàn)證大模型應(yīng)用價(jià)值的助推器,但歸根結(jié)底,大模型效果好不好用,能不能帶來業(yè)務(wù)增長才是制勝的關(guān)鍵。
來源: ??51CTO技術(shù)棧??作者:今日晴
