提前免費(fèi)!百度一口氣上線文心4.5和X1!實(shí)力震驚硅谷!API價格又打下來了,R1還得對半砍! 原創(chuàng)
編輯 |伊風(fēng)、言征
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
百度的步伐也是加速了!
原本計(jì)劃4月1日免費(fèi)的文心大模型4.5,在兩周年之際就提前登場。
不僅如此,3月16日,百度搞了個“兩連發(fā)”,一口氣開放了兩款模型文心大模型4.5和文心大模型X1。
目前均在官網(wǎng)免費(fèi)向用戶開放了!百度還貼心的給了精煉的模型介紹,以方便用戶選擇合適的模型。文心X1的介紹是“深度思考,更聰明”;文心4.5的介紹是“效果出色,更全能”。
圖片
(https://yiyan.baidu.com)
文心大模型4.5的“全能”,具體體現(xiàn)在多模態(tài)能力上——這是百度自主研發(fā)的新一代原生多模態(tài)基礎(chǔ)大模型。其在多項(xiàng)基準(zhǔn)測試中表現(xiàn)優(yōu)于OpenAI的GPT4.5,API調(diào)用價格僅為GPT4.5的1%。
而文心大模型X1則是一款深度思考模型,性能對標(biāo)DeepSeek-R1,具備“長思維鏈”,擅長中文知識問答、文學(xué)創(chuàng)作、邏輯推理等。值得一提的是,它還增加了多模態(tài)能力和多工具調(diào)用功能,能夠理解和生成圖片,調(diào)用工具生成代碼、圖表等內(nèi)容。而文心大模型X1的API調(diào)用價格約為DeepSeek-R1的一半,真的是卷瘋了!
此外,文心大模型4.5已上線百度智能云千帆大模型平臺,企業(yè)用戶和開發(fā)者登錄即可調(diào)用API;文心大模型X1也即將在千帆上線。百度搜索、文小言APP等產(chǎn)品,也將陸續(xù)擁抱這兩款新模型。
圖片
這個動作一出,外網(wǎng)也是歡呼一片!
一位網(wǎng)友說“百度,aka中國的谷歌,開放了兩款新模型”,并評價道,“中國在繼續(xù)構(gòu)建更有成本更低的智能。AI價格戰(zhàn)正在打響。”
圖片
還有網(wǎng)友制作了視頻,這一波會讓追隨DeepSeek的用戶倒戈百度!
百度還計(jì)劃于2025年6月30日正式將文心大模型4.5開源,并在下半年發(fā)布文心大模型5.0。看完文心的這兩款新模型,你可能會對百度后續(xù)的動作充滿期待!
1.文心4.5,一張全能王牌
文心4.5的技能樹點(diǎn)得有多滿呢?
百度官方說,文心4.5“具備更精進(jìn)的語言能力,理解、生成、邏輯、記憶能力全面提升,去幻覺、邏輯推理、代碼能力顯著提升?!?/p>
多模態(tài)能力
文本能力
我們先來測測文心4.5的代碼能力,讓AI幫忙做一個“少女心爆棚”的貪吃蛇游戲:
“寫一個貪吃蛇的代碼,選擇可以在網(wǎng)頁中運(yùn)行的程序,希望是粉紅色戴著蝴蝶結(jié)的貪吃蛇”
看得出文心的代碼習(xí)慣還是不錯的
保存到html文件里運(yùn)行了一下,確實(shí)能run,基本的要素都是有的。只不過AI做了一個小三角形當(dāng)做簡陋版蝴蝶結(jié),另外就是蛇飛得太快了,不好操作,這點(diǎn)其實(shí)自己改改參數(shù)就能解決了:
然后再來考驗(yàn)下文心4.5的長項(xiàng)——文本生成。
“幫我寫一個能讀給成年人聽的睡前故事,希望是溫暖、治愈的,3分鐘內(nèi)可以讀完。”
文心很快就搞定了這個故事,大家來看看夠不夠治愈呢~
圖片
接下來,我們又小小的開了腦洞,讓文心4.5根據(jù)故事,生成一頁繪本。
這就是《星星郵遞員與小城老人》的繪本了,其實(shí)我私心希望郵遞員能夠有個擬人化的形象,這里能看出畫風(fēng)整體還是沒毛病的:
圖片
文心官方介紹說,4.5是智商、情商雙高的模型:“文心大模型4.5也擁有“高情商”,網(wǎng)絡(luò)梗圖、諷刺漫畫等等,理解起來都不在話下?!?/p>
我們也測了一張梗圖,畫手是怎么看待AI的陣營九宮格。
圖片
AI是這樣解讀的,可以看出AI在很認(rèn)真地解讀笑點(diǎn),這就讓梗圖的幽默被消解了不少。而且對于九宮格出現(xiàn)的“椰樹椰汁?!薄熬呸D(zhuǎn)大腸?!钡鹊龋€不會進(jìn)行解讀,理解少有些瑕疵,可能無法完美幫助需要理解一張meme的人。
圖片
2.推理模型X1,第一個有工具箱的推理模型
至于文心X1的亮點(diǎn),一句話就能講清楚“文心大模型X1具備更強(qiáng)的理解、規(guī)劃、反思、進(jìn)化能力,并支持多模態(tài),最重要的,這是首個自主運(yùn)用工具的深度思考模型?!?/p>
根據(jù)百度介紹“作為能自主運(yùn)用工具的大模型,文心大模型X1已支持高級搜索、文檔問答、圖片理解、AI繪圖、代碼解釋器、網(wǎng)頁鏈接讀取、TreeMind樹圖、百度學(xué)術(shù)檢索、商業(yè)信息查詢、加盟信息查詢等多款工具?!?/p>
我們先來看看AI調(diào)用繪圖工具的能力吧,最近的315也是帶來了很多重磅炸彈,讓消費(fèi)者直捂胸口。我們希望能AI能生成一張高信息密度的海報(bào),讓我們看一眼就了解今年的315晚會重點(diǎn)。
“搜集315晚會打假產(chǎn)品名單,生成一張海報(bào)”。
然后AI就能自主拉起“高級聯(lián)網(wǎng)”工具,幫我們搜索315相關(guān)的新聞線索。
圖片
在擁有了一份打假名單后,AI又開始使用繪圖工具,給我們繪制海報(bào)了。
圖片
到這一步AI看起來都干的不錯,只不過,最終的海報(bào)成品是這樣的:
???為啥啊。
圖片
看來,百度的繪畫產(chǎn)品仍然沒能突破“生成漢字”的難關(guān)。
不過,對于圖表問題,文心X1還是靠譜的,我們用熱搜最新的“用人民幣感受韓國的工資水平”,讓AI幫我們梳理個圖表。
圖片
AI會自己進(jìn)行任務(wù)的拆解:
圖片
然后就能以更直觀的視角“吃瓜”了:
圖片
總體實(shí)驗(yàn)下來,百度的自主工具調(diào)用還沒有完全成熟。在一個案例測試中,小編希望能得到一個樹圖形式的答案,但AI卻堅(jiān)決調(diào)用“代碼解釋器”,并且在幾次嘗試中均沒有coding成功,最后只能給了文本答案。
不過,百度邁出的這一步還是相當(dāng)有意義,相信X1能很快擁有更好用、更匹配的工具,方便AI為我們辦公。
3.寫在最后
百度的加速,反映了國內(nèi)大模型市場競爭的白熱化。免費(fèi)開放文心4.5和X1,不僅是產(chǎn)品迭代的常規(guī)升級,更是面對行業(yè)競爭的一次主動出擊。
要知道,此前阿里的推理模型QwQ也在預(yù)覽版里規(guī)劃了各種工具調(diào)用,只不過當(dāng)時未能上線。這才一晃神的功夫,就被百度的X1偷家了。
這說明,大模型技術(shù)的演進(jìn)已進(jìn)入分毫必爭的階段,這種微弱的領(lǐng)先更讓場上的局勢波云詭譎。接下來,隨著模型能力的持續(xù)提升,競爭將不止于參數(shù)、推理速度和工具集成,如何真正提升用戶體驗(yàn),可能才是決定市場格局的關(guān)鍵。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:伊風(fēng)
