出品 | 51CTO技術(shù)棧(微信號(hào):blog51cto)
2024,大家不再卷參數(shù)卷測(cè)評(píng)了,開始卷應(yīng)用了。但,誰又知道AI原生應(yīng)用什么樣?怎么做?這個(gè)學(xué)費(fèi)不好交。
令人興奮地是,AI大佬李彥宏今天終于現(xiàn)身說法。
4月16日,李彥宏輕裝上陣,在百度AI開發(fā)者大會(huì)一股腦將百度過去一年實(shí)踐出來的、開發(fā)AI原生應(yīng)用的具體思路和工具全都放出來了。
Robin一口氣接連放出了百度三大AI原生應(yīng)用的開發(fā)利器:ModelBuilder、AgentBuilder、AppBuilder,可以說這三個(gè)Builder完美彌合了從大模型到應(yīng)用誕生的鴻溝。一時(shí)間現(xiàn)場(chǎng)掌聲不斷。
“我相信文心大模型將成為中國AI創(chuàng)業(yè)者和開發(fā)者的首選!”作為國內(nèi)首發(fā)且大模型綜合能力極為靠前的文心一言,在應(yīng)用層面也是布局最早最全面的,李彥宏自信滿滿:越來越多的應(yīng)用會(huì)建立在文心大模型之上,也期待更多的創(chuàng)業(yè)者和開發(fā)者加入我們一起去創(chuàng)造未來。
1.百度第一劍,先斬開源大模型
李彥宏開場(chǎng)致辭,首先亮出了文心一言的成績(jī)單。
據(jù)介紹,文心一言于去年3月16日正式發(fā)布,截至目前用戶數(shù)已經(jīng)突破2億,每天API的調(diào)用量突破2億,服務(wù)客戶數(shù)達(dá)到8.5萬,利用千帆平臺(tái)開發(fā)的AI原生應(yīng)用數(shù)超過19萬。
圖片
回顧過往一年,文心4.0的發(fā)布是一道分水嶺。
李彥宏表示,文心4.0之后,百度可以根據(jù)需要,剪裁出適合各種場(chǎng)景的更小尺寸模型,并且支持精調(diào)和post-pretrain。
post-pretrain是一種模型預(yù)訓(xùn)練策略,是指基礎(chǔ)模型預(yù)訓(xùn)練后,繼續(xù)使用無標(biāo)記數(shù)據(jù)對(duì)模型進(jìn)行預(yù)訓(xùn)練,旨在提升模型通用語言表達(dá)能力。
在同等尺寸下,通過post-pretrain的模型,會(huì)比直接開源的模型效果更好;在同等效果下,其成本會(huì)會(huì)更低。
在這一參照下,李彥宏給定結(jié)論:“開源模型會(huì)越來越落后”。
圖片
2.大小模型混用才是王道,開發(fā)應(yīng)用會(huì)像拍短視頻一樣簡(jiǎn)單
對(duì)于大模型本身,李彥宏曾放言:大模型已經(jīng)夠多了,沒有必要卷大模型,應(yīng)該卷應(yīng)用。
如今,他也依然堅(jiān)持自己的判斷:大模型本身并不能直接創(chuàng)造價(jià)值,基于其開發(fā)的AI原生應(yīng)用才是市場(chǎng)需求所在。
在此前提下,李彥宏重點(diǎn)提到了三個(gè)行業(yè)關(guān)鍵詞。
其一,MoE。此處的MoE并非狹義上的機(jī)器學(xué)習(xí)領(lǐng)域的概念“混合專家模型”,指的是更廣義上的大小模型的混用。通常來說,只有5%-10%的情景需要大模型,其余30%-40%的情況需要中小模型。
李彥宏預(yù)判,未來大型的AI原生應(yīng)用基本都是MoE的。針對(duì)不同的應(yīng)用場(chǎng)景,不依賴一個(gè)模型來解決所有問題,判斷如何調(diào)用大小模型,就形成了MoE混用模式。
其二,小模型。小模型推理成本低,響應(yīng)速度快,在一些特定場(chǎng)景中,經(jīng)過精調(diào)后的小模型,其使用效果甚至可以媲美大模型。通過大模型壓縮蒸餾出一個(gè)基礎(chǔ)模型,然后再用數(shù)據(jù)去訓(xùn)練。這比從頭開始訓(xùn)小模型,效果要好很多,也比基于開源模型訓(xùn)出來的模型,效果、速度和成本表現(xiàn)都更好。
目前,百度已經(jīng)發(fā)布了ERNIE Speed,ERNIE Lite、ERNIE Tiny三個(gè)輕量級(jí)大模型,并將其內(nèi)置于Model-Builder中,以便為開發(fā)者提供更高效靈活的大模型應(yīng)用方案,以此適應(yīng)不同場(chǎng)景的需求。
其三,智能體。智能體指的是能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體。在大模型驅(qū)動(dòng)下,以自然語言為交互,可以自主完成復(fù)雜任務(wù),在環(huán)境中持續(xù)學(xué)習(xí)、實(shí)現(xiàn)自我迭代和自我進(jìn)化。它們可以更大程度地釋放人員精力,讓人更專注于創(chuàng)造性和決策性的事務(wù)。
李彥宏稱,大模型和生成式AI將徹底改變開發(fā)者群體,“過去開發(fā)者用代碼改變世界,未來自然語言將成為通用編程語言?!?/p>
基于文心大模型的智能代碼助手Comate,可以推薦代碼、生成代碼注釋、查找代碼缺陷、給出優(yōu)化方案,還可以解讀代碼庫、關(guān)聯(lián)私域知識(shí)生成新的代碼。
官方信息顯示,百度每天新增的代碼中,已經(jīng)有27%是由Comate自動(dòng)生成的;Comate還與喜馬拉雅、三菱電梯等上萬家企業(yè)合作,生成的代碼采納率達(dá)到46%。
“今天,你不會(huì)寫代碼,也可以做出一個(gè)應(yīng)用;不用編程,也可以做出一個(gè)智能體“,李彥宏表示,未來開發(fā)應(yīng)用就會(huì)像拍短視頻一樣簡(jiǎn)單,人人都是開發(fā)者。
圖片
3.百度已經(jīng)不滿足只做基座,而是要打造一個(gè)智能體平臺(tái)
“人人可開發(fā)、人人經(jīng)營、人人可獲益”,其實(shí)百度早在去年秋天就在內(nèi)部投入精力去打造智能體構(gòu)建平臺(tái)AgentBuilder,主打高效便捷。
提及智能體(Agent),市面上有許多討論,李彥宏這次直接點(diǎn)名了Agent,并認(rèn)為Agent可能是未來離每個(gè)人最近、最主流的大模型使用方式,基于強(qiáng)大的基礎(chǔ)模型,智能體可以批量生成,應(yīng)用在各種各樣的場(chǎng)景。
作為基于文心大模型的智能體構(gòu)建平臺(tái),AgentBuilder為開發(fā)者提供了零代碼和低代碼兩種模式。無論是專業(yè)人員還是編碼小白,都能快速上手。
此外,AgentBuilder不止是開發(fā)平臺(tái),開發(fā)者還可以通過百度生態(tài)矩陣分發(fā)路徑,做到“開發(fā)+分發(fā)+運(yùn)營+變現(xiàn)”一體化賦能。
開發(fā)者的智能體可以通過百度搜索、小度、文心一言、百度地圖、車機(jī)等多場(chǎng)景、多設(shè)備實(shí)現(xiàn)分發(fā),未來還將接入商業(yè)插件功能,進(jìn)一步實(shí)現(xiàn)商業(yè)閉環(huán)。
截至目前,已經(jīng)有3萬多個(gè)智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。
“打造國內(nèi)最完整的智能體生態(tài)”,百度正當(dāng)其時(shí)!
除了AgentBuilder,李彥宏還介紹了另外兩大開發(fā)利器AppBuilder和ModelBuilder。它們同樣支持開發(fā)者開箱即用。
圖片
早在去年三月,百度推出“千帆大模型平臺(tái)”時(shí)就囊括了AppBuilder和ModelBuilder兩部分。
如今,AppBuilder工具組件擴(kuò)增至55個(gè),并上線了“三步生成應(yīng)用”功能。
作為產(chǎn)業(yè)級(jí)AI原生應(yīng)用開發(fā)平臺(tái),AppBuilder封裝和預(yù)置了開發(fā)AI原生應(yīng)用所需的各種組件和框架,最快只需三步,開發(fā)者就可以用自然語言開發(fā)出一個(gè)AI原生應(yīng)用。
目前大量的開發(fā)者已通過AppBuilder生成豐富的AI原生應(yīng)用,包括智能導(dǎo)購客服、心理咨詢助手、營銷素材生成、智能數(shù)據(jù)分析等等。
而適用于模型定制的ModelBuilder則是更適合專業(yè)開發(fā)者使用的工具。
ModelBuilder提供了包括文心大模型系列在內(nèi)的77款精選大模型,內(nèi)置業(yè)內(nèi)最多的47個(gè)數(shù)據(jù)集和119個(gè)產(chǎn)業(yè)級(jí)Prompt模板。還設(shè)置了模型精調(diào)樣板間,開發(fā)者只需要跟著樣板間一步一步精調(diào),就能做出一模一樣的專業(yè)模型。
4.多模型智能計(jì)算OS萬源亮相,云原生系統(tǒng)危險(xiǎn)了
本次百度AI開發(fā)者大會(huì)上,還有一個(gè)重磅炸彈。
百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖冷不防就來了一個(gè)大招:智能計(jì)算操作系統(tǒng)萬源,而且同時(shí)支持包括文心一言、第三方大模型在內(nèi)的77個(gè)大模型。
在AI原生時(shí)代,算力是至關(guān)重要的新質(zhì)生產(chǎn)力。但是,在運(yùn)營和管理過程中,智算中心也面臨重重挑戰(zhàn):異構(gòu)算力資源納管困難、算力調(diào)度能力不足、利用率低等等。
沈抖提到,基于國內(nèi)芯片供應(yīng)的不確定性,在進(jìn)行單一任務(wù)訓(xùn)練時(shí)往往會(huì)面臨多芯局面。為了更好地調(diào)度算力資源、減少性能損耗,百度推出了“萬源”。
這是一個(gè)強(qiáng)大的操作系統(tǒng),可以把現(xiàn)有的算力資源發(fā)揮到極致來支撐大模型,以有效應(yīng)對(duì)目前國內(nèi)GPU等算力不確定性的問題。
據(jù)沈抖介紹,萬源是百度全新發(fā)布的一個(gè)單一任務(wù)一云多芯大模型訓(xùn)練解決方案,解決了當(dāng)下百卡甚至千卡混合訓(xùn)練場(chǎng)景下性能損耗太大的問題,同時(shí)昆侖芯、昇騰、Intel、NVIDA等多種型號(hào)的主流芯片,讓他們高效綁定在一起就像一塊芯片一樣工作!
萬源OS在框架層面,一手以文心大模型、百舸AI異構(gòu)計(jì)算平臺(tái)為內(nèi)核(萬卡集群有效訓(xùn)練時(shí)長(zhǎng)占比高達(dá)98.8%,線性加速比95%),一手以ModelBuilder、AgentBuilder、AppBuilder為Shell/Toolkit,讓這些極簡(jiǎn)易用的設(shè)計(jì)取代云原生系統(tǒng)的復(fù)雜性,從而推動(dòng)加速AI原生應(yīng)用的爆發(fā)。
圖片
不得不說,簡(jiǎn)單是終極的復(fù)雜!萬源系統(tǒng)做到了!
5.百度移動(dòng)大變天,該改名叫AI原生應(yīng)用部門了
一個(gè)時(shí)代有一個(gè)時(shí)代的印記。在AI原生應(yīng)用時(shí)代,百度移動(dòng)已經(jīng)煥然一新,百度搜索、百度文庫、百度地圖在今天的大會(huì)上也給出了全新的智能化進(jìn)展。
百度移動(dòng)生態(tài)部門在今年也化身百度智能體浪潮的先鋒官,勇立潮頭為業(yè)界做了一次最佳示范。
比如全場(chǎng)景語音指令可隨時(shí)隨地高效創(chuàng)作的新文庫(據(jù)悉,已經(jīng)有累計(jì)1億+AI用戶數(shù),功能使用次數(shù)達(dá)8億+),再比如文心一言App升級(jí)成了萬能搭子(為寶媽寶爸哄娃講睡前故事,練習(xí)英語等,目前已經(jīng)有30萬創(chuàng)作者,40萬的智能體,8億調(diào)用量)。
下面是一些精彩畫面:
圖片
圖片
圖片
對(duì)了,據(jù)悉百度營銷這塊還推出了商家智能體,可以商家全天候地獲得線索并服務(wù)用戶,獲得線索的成本直降29%。具體都有哪些行業(yè)呢?目前看最受歡迎是教育培訓(xùn)、房產(chǎn)家居、機(jī)械設(shè)備、商務(wù)服務(wù)等30多家行業(yè)。
同時(shí),百度集團(tuán)資深副總裁何俊杰還重點(diǎn)推薦了一個(gè)電商直播智能體:慧播星,擁有了它簡(jiǎn)直就像擁有了一支風(fēng)格各異、舌燦蓮花的主播天團(tuán)。智能問答、智能腳本、智能場(chǎng)控,可謂一站式全天候在線。據(jù)悉,目前已經(jīng)陸續(xù)上線了不少明星版本,包貝爾的智能體還獲得了帶貨榜第一名。
圖片
此外,大家熟知的對(duì)話機(jī)器人也迎來了重磅升級(jí),DUER OS X發(fā)布!據(jù)悉它搭載了1.1萬個(gè)語音智能應(yīng)用,更細(xì)化定制生態(tài)層的重構(gòu)。
AI原生也成為了小度脫離存量競(jìng)爭(zhēng)的秘鑰,如今的小度變得更加聰明、更加freestyle的交互、甚至更主動(dòng)發(fā)起后續(xù)的追問、而且聲音更擬人、表情也更加豐富。
圖片
6.卷應(yīng)用,但背后仍是大模型進(jìn)化技術(shù)的較量
一年時(shí)間,文心大模型得到了快速的進(jìn)化,從文心一言3.0到現(xiàn)在的集萬卡算力、飛槳平臺(tái)、多維數(shù)據(jù)、多階段對(duì)齊、可再生訓(xùn)練等多位一體的文心大模型4.0(半年時(shí)間又提升了52.5%),再到工具版4.0的推出,這背后都是百度團(tuán)隊(duì)交出的高昂學(xué)費(fèi)、踩過無數(shù)個(gè)坑得出來的不易成果。
圖片
此外,百度首席技術(shù)官王海峰還介紹了百度團(tuán)隊(duì)高效低成本的模型生產(chǎn)心得:大小模型協(xié)同訓(xùn)練(知識(shí)繼承、對(duì)比增強(qiáng)技術(shù)),高效預(yù)訓(xùn)練、精調(diào)對(duì)齊、模型壓縮、推理部署、數(shù)據(jù)提質(zhì)與增強(qiáng)方面都有著很多經(jīng)驗(yàn)沉淀。
在多模型推理方面,百度團(tuán)隊(duì)還研制了基于反饋學(xué)習(xí)的端到端多模型推理技術(shù)。
圖片
星河已現(xiàn),強(qiáng)大、敏捷、開放,正是背后百度文心模型的持續(xù)創(chuàng)新,才造就了如今百度繁榮AI生態(tài)的堅(jiān)實(shí)底座!
這次百度的開發(fā)者大會(huì)為我們描繪了一個(gè)“人人都是創(chuàng)造者”的未來。
在AI原生時(shí)代,AI已不再僅僅是少數(shù)專家的專屬領(lǐng)地,而是逐步滲透到千行百業(yè)中的普適性工具。
無論個(gè)體的專業(yè)背景、職業(yè)角色或技術(shù)熟練度如何,隨著用戶友好的AI開發(fā)平臺(tái)、零代碼編程工具等資源的日益豐富和完善,開發(fā)門檻顯著降低,使得非專業(yè)人士也能輕松利用AI技術(shù)實(shí)現(xiàn)創(chuàng)意落地。
日新月異的技術(shù)如同堅(jiān)實(shí)的地基,支撐起一座座創(chuàng)新的燈塔,鼓勵(lì)無數(shù)后來者跨越技術(shù)邊界,打破傳統(tǒng)桎梏,共同點(diǎn)亮人類社會(huì)的未來星空。