自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?

發(fā)布于 2025-2-24 10:17
瀏覽
0收藏

編輯 | 伊風(fēng)

出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)

年初,DeepSeek-R1模型的開(kāi)源讓這個(gè)低調(diào)的技術(shù)品牌一炮打響。

隨著DeepSeek應(yīng)用的飛速增長(zhǎng),AI巨頭正在集體重新審視開(kāi)源模式的商業(yè)價(jià)值——這不再只是“賠本賺吆喝”的事情,而是可能帶來(lái)實(shí)實(shí)在在的商業(yè)回報(bào)。

DeepSeek帶來(lái)的競(jìng)爭(zhēng)壓力肉眼可見(jiàn),連OpenAI的Altman都罕見(jiàn)地改口反思,承認(rèn)OpenAI在開(kāi)閉源問(wèn)題上“站在了歷史錯(cuò)誤的一端”。Altman 甚至在X上發(fā)起了投票,詢問(wèn)大家OpenAI的下一個(gè)開(kāi)源項(xiàng)目是一個(gè)o3 mini級(jí)的模型好,還是開(kāi)源一個(gè)端側(cè)模型好。

而在國(guó)內(nèi),同樣坐不住的還有曾經(jīng)的閉源信仰者——百度。2月中旬,百度接連拋出一系列大動(dòng)作:

  • 2月11日,文小言(原文心一言)更新,新版本正式接入DeepSeek-R1模型;
  • 2月13日,百度宣布文心一言將于4月1日起全面免費(fèi);
  • 2月14日,百度官宣:未來(lái)幾個(gè)月將陸續(xù)推出文心大模型4.5系列,并計(jì)劃在6月30日正式開(kāi)源。

其中最出人意料的,還是百度在“開(kāi)源 vs. 閉源”問(wèn)題上的180度轉(zhuǎn)向。曾經(jīng),李彥宏曾直言“開(kāi)源大模型是智商稅”“開(kāi)源模型只會(huì)越來(lái)越落后”,而如今,面對(duì)現(xiàn)實(shí)的百度卻決定“打不過(guò)就加入”,主動(dòng)順應(yīng)開(kāi)源潮流。

不過(guò),細(xì)品百度的開(kāi)源計(jì)劃,會(huì)發(fā)現(xiàn)它與DeepSeek的開(kāi)源或許仍有本質(zhì)不同。DeepSeek采取的是“上線即開(kāi)源”的模式,而百度的開(kāi)源方案更顯謹(jǐn)慎:未來(lái)幾個(gè)月用戶或在產(chǎn)品側(cè)先行體驗(yàn)文心4.5系列,但真正的開(kāi)源要等到年中才正式落地。

而2025的下半年,才是百度的重頭戲。根據(jù)外媒CNBC的爆料,百度Ernie 5.0預(yù)計(jì)將在今年下半年發(fā)布,并在多模態(tài)能力上有重大增強(qiáng)。知情人士透露,新模型可能會(huì)在文本、圖像、視頻、音頻的理解和轉(zhuǎn)換上邁出更大步伐,例如生成更自然的AI視頻內(nèi)容。

從某種程度看,百度的Ernie 4.5開(kāi)源,很可能是在給 5.0“投石問(wèn)路”。在全面邁入開(kāi)源賽道之前,百度似乎更想先試探市場(chǎng)反應(yīng),看看這條路是否值得走到底。

1.月活被反超,百度系模型真落后了嗎?

關(guān)于百度的下次開(kāi)源是否能激起水花,有一個(gè)繞不開(kāi)的問(wèn)題:百度在大模型的技術(shù)方面是否已經(jīng)落后?

從技術(shù)方面看,百度可能與頭部模型廠商并未拉開(kāi)太大差距。

但百度大模型失去競(jìng)爭(zhēng)力的觀點(diǎn)一直充斥于網(wǎng)絡(luò),究其原因有以下幾方面。

首先,作為國(guó)內(nèi)最早入局者,百度文小言確實(shí)沒(méi)能守住第一的位置,

再加上“起大早、趕晚集”的論調(diào)時(shí)不時(shí)就拿出來(lái)炒作一番,使得很多人覺(jué)得百度的大模型也會(huì)“爛尾”。

兩年前,百度是大廠中最早做大模型的,2023年3月就開(kāi)始內(nèi)測(cè)Chatbot應(yīng)用文心一言,趕來(lái)嘗鮮的用戶擠滿了排隊(duì)列表。但文心一言在月活上的領(lǐng)先優(yōu)勢(shì)只維持了一年之久,此后便逐漸被Kimi、豆包等一眾后來(lái)者反超。

不過(guò),雖然AI應(yīng)用的月活量無(wú)法完全反映一家模型廠的技術(shù)水平。目前,文心一言Web端的訪問(wèn)量在國(guó)內(nèi)AI產(chǎn)品位列第6,落后于DeepSeek和承接了DeepSeek流量的納米AI搜索、投流比較猛的豆包、Kimi以及非AI原生的百度文庫(kù)。僅從應(yīng)用排名看,無(wú)法證明百度的技術(shù)存在大幅落后。

這里引出了第二個(gè)問(wèn)題:百度文庫(kù)月活量的趕超以及在商業(yè)化上的亮眼表現(xiàn),似乎多少給外界傳遞了一種文小言被內(nèi)部放棄的信號(hào)。

例如,李彥宏1月初發(fā)的百度內(nèi)部信中,提到“我們?cè)诖竽P蛻?yīng)用領(lǐng)域獨(dú)樹(shù)一幟,為4000萬(wàn)文庫(kù)的付費(fèi)用戶提供無(wú)與倫比的內(nèi)容創(chuàng)作……”,卻未提及AI原生出身的文心一言。

需要明確的是,從應(yīng)用層上,文小言在內(nèi)部的地位是否滑落,我們不得而知。但模型層上,文心仍然是為百度文庫(kù)做賦能的技術(shù)基座,那就不存在被放棄的問(wèn)題。

第三,百度的閉源生態(tài)和過(guò)早開(kāi)啟的訂閱制度,要為百度日活被反超的事實(shí)“背一部分鍋”。

2023年11月,文心一言就開(kāi)做會(huì)員收費(fèi),這意味著非付費(fèi)用戶從此無(wú)法接觸最先進(jìn)的文心4.0模型。百度悶聲掙大錢的態(tài)度忽視了必要的技術(shù)宣傳,甚至立場(chǎng)鮮明地支持閉源,發(fā)表一系列“開(kāi)源模型只會(huì)越來(lái)越落后”的觀點(diǎn)。

此刻再宣布開(kāi)源,很難給用戶好的觀感。

最后,由于重視商業(yè)化的策略,加上大模型“燒錢”的客觀現(xiàn)實(shí),百度一度被傳出“預(yù)訓(xùn)練終止”的消息。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)圖片

對(duì)此,百度CTO王海峰曾辟謠,表示“相信大家非常關(guān)心基礎(chǔ)大模型的進(jìn)展。我可以很篤定地告訴大家,文心大模型仍在持續(xù)訓(xùn)練中,敬請(qǐng)期待更強(qiáng)大的新版本?!?/p>

那么,有關(guān)基礎(chǔ)模型訓(xùn)練的真相如何?百度開(kāi)源還有機(jī)會(huì)嗎?

2.百度模型進(jìn)展到哪了?守住了哪些優(yōu)勢(shì)?

結(jié)合上一代模型ERNIE 4.0及其Turbo版的表現(xiàn)來(lái)看,百度再度躋身第一、第二梯隊(duì)還是有希望的。

百度發(fā)布于2023年10月的ERNIE 4.0(比GPT4晚發(fā)布7個(gè)月)及2024年6月升級(jí)的ERNIE 4.0 Turbo(比GPT-4o晚發(fā)布一個(gè)月),代表了百度最先進(jìn)的模型技術(shù)。

ERNIE 4.0有明確對(duì)標(biāo)GPT-4,且綜合實(shí)力相當(dāng)。比起后者,ERNIE 4.0在中文語(yǔ)境下的表現(xiàn)相對(duì)更優(yōu),但在復(fù)雜邏輯任務(wù)上遜色于后者。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)圖片

而去年6月發(fā)布的ERNIE 4.0 Turbo,則缺少明確的對(duì)標(biāo)對(duì)象,官方介紹說(shuō)“在性能上實(shí)現(xiàn)了顯著提升”。

根據(jù)智源研究院12月19日的FlagEval“百?!痹u(píng)測(cè)結(jié)果,ERNIE 4.0 Turbo確實(shí)在主觀評(píng)分上處于領(lǐng)先地位,僅次于幾乎同期發(fā)布的Doubao-pro-32k-preview,但客觀估分不高。

以上表明文心可能是個(gè)“重文輕理”的模型。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)上圖:智源研究院 FlagEval“百?!痹u(píng)測(cè)結(jié)果

雖然缺乏公開(kāi)宣傳,但百度也沒(méi)有停止模型更新的步伐。

從百度千帆大模型服務(wù)與開(kāi)發(fā)平臺(tái),查看模型的更新記錄,會(huì)發(fā)現(xiàn)百度的1月底,同樣忙著做推理能力,并甩了一堆的模型更新。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)上圖:百度千帆大模型服務(wù)與開(kāi)發(fā)平臺(tái)



??https://ai.baidu.com/ai-doc/WENXINWORKSHOP/flxu4ej5u??

性能方面,在SuperCLUE的第三方報(bào)告中,百度一個(gè)名為“ERNIE-4.0-Turbo-8K-Latest”的模型,總分62.2,位列該報(bào)告模型的“第四梯隊(duì)”。從命名看出,這是一個(gè)相當(dāng)強(qiáng)悍的8K小模型。這個(gè)模型與DeepSeek-V2.5保持在同一梯隊(duì)中,并且優(yōu)于GPT-4o-mini。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)注:以上數(shù)據(jù)來(lái)自SuperCLUE

此外,百度在垂直場(chǎng)景和多模態(tài)技術(shù)上也有顯著優(yōu)勢(shì)。

商業(yè)化并不意味著沒(méi)有技術(shù)積累,深耕的垂直場(chǎng)景也可能給百度模型帶來(lái)有價(jià)值的反哺,尤其是專業(yè)的高質(zhì)量數(shù)據(jù)。

從官網(wǎng)給出的產(chǎn)業(yè)級(jí)大模型分布圖來(lái)看,百度已經(jīng)在多個(gè)行業(yè)有定制模型。據(jù)報(bào)道,百度文心模型在中文場(chǎng)景下的知識(shí)問(wèn)答、多模態(tài)生成(文本、圖像、語(yǔ)音)能力領(lǐng)先,尤其在金融與教育領(lǐng)域的應(yīng)用成熟度高。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)上圖來(lái)源:文心大模型官網(wǎng)

百度最新發(fā)布的24年財(cái)報(bào)中透露,“12月,文心大模型日均調(diào)用量達(dá)16.5億次,一年增長(zhǎng)33倍?!庇纱丝梢?jiàn),百度在商業(yè)化場(chǎng)景上有獨(dú)特的技術(shù)積累,有很強(qiáng)的可信性。

在多模態(tài)領(lǐng)域,蘋(píng)果的合作選擇或許正是百度優(yōu)勢(shì)的一種側(cè)面印證。盡管蘋(píng)果最終攜手阿里打造國(guó)行AI功能,但據(jù)外媒報(bào)道,其AI圖片識(shí)別功能的開(kāi)發(fā)仍選擇了百度作為合作伙伴。

DeepSeek沖擊下,百度的開(kāi)源牌能打響嗎?-AI.x社區(qū)


此外,文心還是國(guó)家跳水隊(duì)的選擇。百度文心開(kāi)發(fā)了一套智能跳水輔助訓(xùn)練系統(tǒng),可以給跳水運(yùn)動(dòng)員的動(dòng)作實(shí)時(shí)打分、進(jìn)行精準(zhǔn)量化分析、制訂訓(xùn)練計(jì)劃等等。

百度的CTO王海峰曾談過(guò)多模態(tài)的技術(shù)壁壘。他表示“相比文字幻覺(jué),圖片幻覺(jué)更為棘手”,百度進(jìn)一步研發(fā)了檢索增強(qiáng)的文生圖技術(shù),既可以生成精確的圖片,也可以進(jìn)行泛化生圖。

更詳細(xì)的技術(shù)解釋是:大模型先基于用戶的需求進(jìn)行分析理解,自動(dòng)規(guī)劃精確或泛化方案,比如需對(duì)哪些實(shí)體進(jìn)行增強(qiáng);接著在增強(qiáng)階段,對(duì)需要增強(qiáng)的實(shí)體,檢索并選擇相應(yīng)的參考圖。等到了生成階段,百度通過(guò)自研的多模可控生圖大模型,一方面,通過(guò)局部注意力計(jì)算,在保持實(shí)體特征不變的情況下,實(shí)現(xiàn)圖像的高泛化生成,比如根據(jù)牛頓的肖像,生成繪本風(fēng)格的牛頓;另一方面,通過(guò)整體注意力計(jì)算,進(jìn)行高精確的圖像生成,比如生成圖中的汽車跟原圖片完全一致。

再加上多模態(tài)也是Ernie 5.0的最重要的亮點(diǎn),或許百度在這個(gè)維度上有所突破,還有些“壓箱底”的技術(shù)也不是沒(méi)有可能。(有趣的是,同為搜索引擎巨頭的谷歌,其主要優(yōu)勢(shì)也集中在了多模態(tài)技術(shù),且最近發(fā)布的Gemini 2.0性能可圈可點(diǎn)。)

此外,百度在算力層上能真正做到軟硬協(xié)同。其自研芯片(昆侖芯)與自研框架(飛槳PaddlePaddle)深度適配,能顯著提升算力利用率。今年2月,百度還宣布百度智能云已經(jīng)成功點(diǎn)亮昆侖芯三代萬(wàn)卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。并透露了下一步,百度智能云將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。

這不僅為文心大模型迭代提供了足量的"彈藥",更長(zhǎng)遠(yuǎn)的看,百度的方案不依賴英偉達(dá)芯片,提前規(guī)避了風(fēng)險(xiǎn),或能在國(guó)產(chǎn)替代浪潮中占據(jù)關(guān)鍵生態(tài)位。

3.百度發(fā)力開(kāi)源,究竟能不能成為解藥?

DeepSeek效應(yīng)持續(xù)發(fā)酵,海內(nèi)外模型廠商無(wú)不受到震撼。

一部分模型廠商重新回歸了技術(shù)驅(qū)動(dòng)的路線,例如“六小虎”中的Kimi、MiniMax等等。

在DeepSeek開(kāi)源并取得巨大成功后,月之暗面內(nèi)部重新評(píng)估其戰(zhàn)略,團(tuán)隊(duì)復(fù)盤(pán)后認(rèn)為應(yīng)堅(jiān)持基礎(chǔ)模型SOTA(State-of-the-art,當(dāng)前最佳)的目標(biāo)。

而MiniMax的CEO閆俊杰也在采訪中透露,在經(jīng)歷了整整半年多的焦慮后,他終于做出取舍“現(xiàn)在 MiniMax 最重要的目標(biāo)不是增長(zhǎng),也不是收入,是 ‘加速技術(shù)迭代’?!?/p>

另一部分模型廠商則重拾了開(kāi)源計(jì)劃,例如OpenAI。Altman透露了未來(lái)可能的開(kāi)源項(xiàng)目,且提供的選項(xiàng)都很具吸引力。

以上兩個(gè)分類當(dāng)然存在重合,但值得注意的是:開(kāi)源并不等同于技術(shù)驅(qū)動(dòng)。

促使公司開(kāi)源的動(dòng)力有很多。閆俊杰說(shuō),“如果重新選,第一天就應(yīng)該開(kāi)源。因?yàn)殚_(kāi)源能加速技術(shù)進(jìn)化。”但是DeepSeek的奇跡也驗(yàn)證了——開(kāi)源的價(jià)值遠(yuǎn)比我們想象的更深遠(yuǎn)、更多元:開(kāi)源可以打造一個(gè)技術(shù)品牌;開(kāi)源可以為模型贏得美譽(yù)和口碑;開(kāi)源甚至能成為一個(gè)比B端大客戶銷售團(tuán)隊(duì)更有效的商業(yè)化引擎。

百度當(dāng)然也看到了開(kāi)源的價(jià)值。在18日財(cái)報(bào)會(huì)上,李彥宏坦言,DeepSeek的成功給百度上了一課:“從DeepSeek身上,我們學(xué)到了一件事,那就是開(kāi)源最佳模型能大大促進(jìn)人們使用或采納這個(gè)模型。當(dāng)一個(gè)模型開(kāi)源時(shí),人們自然會(huì)出于好奇想嘗試,這有助于更廣泛的采用。文心大模型4.5將是我們有史以來(lái)最好的模型,我們希望用戶和客戶能夠比以往更輕松地試用。”

因此,百度選擇趁早官宣了6月30日文心4.5系列的開(kāi)源,希望借此降低用戶使用門(mén)檻,推動(dòng)生態(tài)繁榮。

但開(kāi)源并非簡(jiǎn)單的“技術(shù)開(kāi)放”那么直接,它牽涉到商業(yè)策略、生態(tài)布局,甚至隱私與安全邊界的考量。相比此前未發(fā)力應(yīng)用的DeepSeek,百度文心已經(jīng)積累了龐大的C端用戶,模型訓(xùn)練可能涉及用戶交互數(shù)據(jù)以及百度自身的搜索、云計(jì)算等數(shù)據(jù)資產(chǎn),因此在開(kāi)源時(shí),必須考慮數(shù)據(jù)安全與合規(guī)性。

百度需要明確開(kāi)源的邊界:是僅開(kāi)放推理權(quán)重,還是進(jìn)一步開(kāi)放訓(xùn)練方法?如何設(shè)定開(kāi)源協(xié)議,既能鼓勵(lì)創(chuàng)新,又能確保數(shù)據(jù)不被濫用?這些都是影響開(kāi)源效果的關(guān)鍵問(wèn)題。

至于此前簽下的政企訂單,百度仍然可以通過(guò)私有化部署確保穩(wěn)定性。事實(shí)上,開(kāi)源與政企客戶并不沖突,合理的“開(kāi)放但可控”策略,反而可能增強(qiáng)企業(yè)客戶的信任度。

歸根結(jié)底,百度開(kāi)源的核心挑戰(zhàn),不只是“開(kāi)源與否”,而是開(kāi)源后能否真正提升文心大模型的行業(yè)影響力。開(kāi)源能帶來(lái)品牌聲量、生態(tài)繁榮,甚至用戶增長(zhǎng),但最終決定一切的,仍然是模型的技術(shù)實(shí)力和落地體驗(yàn)。DeepSeek的爆發(fā)式增長(zhǎng),正是建立在這一前提之上的。百度能否在開(kāi)源后抓住同樣的機(jī)會(huì),還要看文心4.5的實(shí)際表現(xiàn)。

參考鏈接:

1.https://zhuanlan.zhihu.com/p/23667812307

2.https://finance.sina.com.cn/tech/discovery/2024-11-13/doc-incvxpff1200045.shtml

3.https://flageval.baai.ac.cn/#/home

4.https://cloud.tencent.com/developer/article/2495332

5.https://mp.weixin.qq.com/s/VmRFGJitPF9EXi0ZBDp3Pw

6.https://mp.weixin.qq.com/s/opWLjlQvWuf9mqKeP0D4Xg

7.https://cloud.baidu.com/article/3396976

本文轉(zhuǎn)載自 ??51CTO技術(shù)棧??,作者: 伊風(fēng)


收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦
社區(qū)精華內(nèi)容

目錄