百度內(nèi)部總監(jiān)級戰(zhàn)略會議,李彥宏講話內(nèi)容流出,最新一輪人事架構(gòu)調(diào)整,百度不碰Sora視頻生成,不激進推廣,智能體是百度的一個賭注
原創(chuàng) 精選整理 | 言征
近日,百度在迎來了新一輪內(nèi)部組織架構(gòu)調(diào)整不久后,內(nèi)部召開了一次第三季度的內(nèi)部總監(jiān)級的復(fù)盤大會,百度創(chuàng)始人李彥宏發(fā)表了近萬字的講話,百度內(nèi)部總監(jiān)級以上的管理人員參加,重要程度可見一斑。
這場總監(jiān)級的戰(zhàn)略大會中,李彥宏透露了百度接下來的打法,解釋了當下百度的架構(gòu)調(diào)整,做出了對于大模型時代的業(yè)務(wù)形態(tài)如何向前發(fā)展的重要論斷。
內(nèi)容涉及到搜索、數(shù)字人、智能體、大模型調(diào)用、蘿卜快跑等業(yè)務(wù)的發(fā)展戰(zhàn)略。尤其對于整個業(yè)界AI資源緊缺、造血尚早的當下,掌舵者李彥宏對這些業(yè)務(wù)的發(fā)展策略是如何進行取舍的呢?
這篇文章可以讓各位一覽百度內(nèi)部現(xiàn)在的業(yè)務(wù)進展,以及大模型進入應(yīng)用階段后百度掌舵者的思考與取舍之道。這里先為大家梳理幾點:
- 百度搜索的重構(gòu)比較慢,應(yīng)該分兩步走。
- 文心一言改名后的“文小言”,在推廣上不會像字節(jié)跳動的豆包、月之暗面的Kimi那樣激進。
- 百度不碰Sora類的視頻生成,“10年、20年都可能難以商業(yè)化應(yīng)用”。
- ToB業(yè)務(wù)盡量不碰吃力不討好的項目制,盡量推出標準化產(chǎn)品,如果要碰,就得安全地掙到錢
- 看好數(shù)字人,未來主流的產(chǎn)品形態(tài)是真人和虛擬人的交互。
- 智能體,只是百度的一個堵注,而非行業(yè)共識。
- 特斯拉的L4路線方案可以實現(xiàn),關(guān)鍵在于誰先跑出。
以下是我們對李彥宏內(nèi)部講話的觀點整理:
李彥宏的7點戰(zhàn)略取舍
先上干貨,李彥宏最后給出了7點戰(zhàn)略取舍,也是對總監(jiān)會內(nèi)容的一個總結(jié)。首先是四個“取”:繼續(xù)堅持投入下一代模型的訓(xùn)練中;繼續(xù)打造智能體的生態(tài),雖然這還不是產(chǎn)業(yè)的共識;以API調(diào)用為牽引來發(fā)展智能云;蘿卜快跑要繼續(xù)擴大規(guī)模。
然后是三點“舍”:Sora這種視頻生成的投入周期太長了,10年、20年都可能拿不到業(yè)務(wù)收益,那么無論多么火爆,百度都不去做;New App“文小言”的推廣沒必要像豆包、Kimi那樣激進;項目制能不碰就別碰,如果要碰,就得安全地掙到錢。
智能體,只是百度的一個堵注,而非行業(yè)共識
李彥宏對于智能體的看好由來已久,他認為目前,搜索和大模型的結(jié)合,更多應(yīng)該是在智能體上。不過他表示,智能體現(xiàn)在還并不是一個行業(yè)的共識,只是百度下的一個賭注,“我們會認為智能體未來會是內(nèi)容、服務(wù)、信息的新載體,甚至是主要的載體?!?/span>
但基于這樣的假設(shè),李彥宏認為,智能體跟之前的視頻流或者圖文流內(nèi)容生態(tài),都會面臨同樣的問題:你怎么把它分發(fā)出去?
而搜索就是這樣一個主要的分發(fā)通道,“因為智能體的形態(tài)是對話流。如果是靠上下滑動的操作,是沒有辦法跟智能體去做結(jié)合和交互的?!?/span>
此外,李彥宏判斷智能體的趨勢和想象力依然存在。隨著基礎(chǔ)模型越來越強大,智能體的門檻會越來越低;但與此同時,智能體也可以把天花板拉得非常高,因為智能體的自我反思、進化、工具的使用等技術(shù),都還非常早期,以及多智能體的群體協(xié)作,目前在產(chǎn)業(yè)上還沒有看到實際的落地。
因此,李彥宏認為,若是深入到各個場景中去研判,智能體能構(gòu)建的東西還很多,想象力仍然存在。
他還提到,智能體已經(jīng)初步驗證了商業(yè)價值,“今天我們有幾十萬家廣告主,已經(jīng)有上萬家在嘗試接入商業(yè)智能體,讓它的廣告效果更好、轉(zhuǎn)化率更好,然后更好地去觸達和溝通這些目標客戶,并且是愿意真金白銀地付費?!?/span>
李彥宏提o1:代表了OpenAI對智能體的期待
百度自2023年Q4起開始重視智能體的技術(shù)發(fā)展,今年智能體領(lǐng)域越來越火熱。他觀察到,OpenAI發(fā)布的o1模型是基于強化學(xué)習(xí)打造的,代表了OpenAI對智能體的期待,代表了訓(xùn)練范式從Transformer回歸到強化學(xué)習(xí),意味著需要設(shè)計很好的獎勵模型。
百度重構(gòu)搜索應(yīng)該兩步走
李彥宏坦承,百度搜索的重構(gòu)進度是比較慢的,但是他也理解該業(yè)務(wù)歷史沿革周期較長,員工的觀念難以在短時間內(nèi)做出調(diào)整和轉(zhuǎn)變。
基于對搜索的全新認知,李彥宏認為,搜索的重構(gòu)和重建應(yīng)該分成兩步:推搜融合和AI移動生態(tài)結(jié)合。
對于前者,李彥宏指出,搜索做任何的改變,不僅要看對搜索場景下核心業(yè)務(wù)指標的影響,也要看對Feed這個核心業(yè)務(wù)指標的影響。比如空框推薦的本質(zhì)是一種推薦,因為這個詞不是由用戶來Input的,只有用推薦的理念來做才是正解。
而對于后者,李提到,圖像用戶界面和自然語言界面怎么結(jié)合會更自然,這會是未來搜索發(fā)展的一個范式。
未來主流的產(chǎn)品形態(tài):真人和虛擬人的交互
PC和移動互聯(lián)網(wǎng)時代的主流交互形式,是真人和真人的交互,代表產(chǎn)品是微信。李彥宏認為下一代產(chǎn)品則是真人和虛擬人之間的交互?!拔覀儸F(xiàn)在很難想象虛擬人和虛擬人之間的交互有什么實際價值,所以我覺得價值還是落在真人和虛擬人的交互?!?/span>
然而,在摸索真人和虛擬人交互的UseCase過程中,百度面臨著一種陣痛,因為虛擬人的效果開始沒有那么好,此時往上強推,對用戶體驗是一種損害。
但李彥宏對此依然表示樂觀,技術(shù)的進步會倒逼產(chǎn)品的提升,未來虛擬人和真人之間的交互體驗,甚至?xí)^真人和真人之間的交互。
一個很典型的場景就是數(shù)字人直播,李彥宏表示在思考董宇輝、辛巴這樣的大V的特點和能力,能不能被數(shù)字人所復(fù)制,“這里面還是有一點想象空間的”。
對此,李彥宏透露了三點心得:百度電商直播有很大一部分已經(jīng)是數(shù)字人直播,腳本完全由AI生成,真人主播不一定能完全記住,但是數(shù)字人的記憶甚至比真人更好;其二,直播中互動場景,對于數(shù)字人來說還有難度;第三,數(shù)字人直播應(yīng)該對標視頻中的真人能力,而不是直播中的真人能力。
此外,李彥宏認為,數(shù)字人直播和智能體是同根同源的,因為數(shù)字人直播有自己的知識庫,和workflow這些基本要素。當智能體和多模態(tài)兩塊技術(shù)相結(jié)合,可能就是未來數(shù)字人的演進方向。
ScalingLaw依然有效:未來更多合成數(shù)據(jù)會被用于訓(xùn)練
目前對Scaling Law的質(zhì)疑聲越來越多,但李彥宏認為,中國市場環(huán)境中其實很多有價值的數(shù)據(jù)還沒有被真正應(yīng)用于訓(xùn)練,比如直播相關(guān)的數(shù)據(jù)和多模態(tài)數(shù)據(jù)。
在他看來,強化學(xué)習(xí)和Scaling Law一樣面臨著算力和數(shù)據(jù)的瓶頸,未來更多訓(xùn)練數(shù)據(jù)會靠合成數(shù)據(jù)來補充,而且是要靠對技術(shù)或者場景的具體理解來合成。
人工智能還有很多的價值有待釋放
李彥宏判斷,未來智能體能大幅提高人類的工作效率,但要釋放智能體的潛力,還需要很多技巧。2023年3月,李彥宏曾提到50%的人類工作,到最后還是提示詞工程。如今,他還是持相同的觀點。打磨提示詞,是釋放智能體潛力的其中一個技巧。
再者,李彥宏提到,智能體上下文的語境中有個很重要的概念,叫“工作流”。工作流簡單來講就是“套路”,如果能把套路拆解清楚,那它就成了工作流,未來AI和機器就能把它自動化。
“今天世界上大部分方法論,其實還沒有被數(shù)字化?!崩顝┖暾J為,其中還有很大的價值釋放。
大模型的調(diào)用:API調(diào)用質(zhì)量更重要
當下,李彥宏比較重視API的調(diào)用量,因為調(diào)用量越大,反饋越多,就能去提升基礎(chǔ)模型的能力,也代表市場對百度基礎(chǔ)模型能力的認可。
同時,李彥宏也提到了一個非共識的判斷:
API的調(diào)用質(zhì)量比數(shù)據(jù)更重要。如果只強調(diào)調(diào)用數(shù)量的話,很容易引起作弊;
大模型蒸餾的小模型更有競爭力
李彥宏提到,現(xiàn)在大模型的調(diào)用有一些新的共識,比如通過大模型蒸餾出的小模型,在小模型當中是很有競爭力的,會比從頭開始訓(xùn)的小模型能力更強。
大模型的效果整體還是優(yōu)于調(diào)優(yōu)過后的小模型。如果對響應(yīng)速度和推理成本要求很高,可能更適合使用調(diào)優(yōu)后的小模型;但對時間不敏感,想要效果好,還是用大模型。
AGI是百度的長期目標,百度不追求榜單排名
李彥宏認為,AGI不可能是半年、一年內(nèi)就能實現(xiàn)的。因此在發(fā)展過程中,百度需要有所取舍。李彥宏提到,短期內(nèi)大模型還是要為場景去做優(yōu)化,他也不追求一個統(tǒng)一的、通用的、在排行榜上能測出來第幾名的大模型,而是想看看在應(yīng)用場景中,百度的模型是不是超越了競品,是不是真正實現(xiàn)了比真人做的東西更好、效率更高。
關(guān)于團隊組織形式,他認為百度要內(nèi)外部的協(xié)同,比如共享研發(fā)資源,共同承擔(dān)研發(fā)成本,而且要確定在百度選定的核心場景中去領(lǐng)先,而不是追求一個完全通用和強大的版本。
無人駕駛:特斯拉的L4路線方案可以實現(xiàn),關(guān)鍵在于誰先跑出
李彥宏提到,所謂的L4的技術(shù)路線一直都有爭論:一條是所謂的特斯拉堅持的端到端純視覺,另一條是基于規(guī)則的路線。在他看來,兩條路線各有各的道理,主要看誰先跑出L4。
比如,今天特斯拉的方案,能不能在武漢實現(xiàn)完全無人化駕駛,或者兩到三年后能不能超越分層的端到端。李彥宏認為,二三十年后是可以實現(xiàn)的,但是拐點在哪里,決定了百度現(xiàn)在采用什么技術(shù)路線去解決這個問題。
針對2024年7月蘿卜快跑代替人類司機的話題,李彥宏認為,搞創(chuàng)新就是要去替代那些最辛苦的工作,讓勞動力轉(zhuǎn)移到更不辛苦的工作上去。技術(shù)的進步,總體來說還是比較積極的。AI 和大模型帶來的機遇中,應(yīng)該也包含著組織創(chuàng)新和流程創(chuàng)新的機遇。
數(shù)據(jù)飛輪是AI原生應(yīng)用的充要條件
李彥宏認為,數(shù)據(jù)飛輪是AI原生應(yīng)用成功的充分必要條件,但這其中還有很多大家想不清楚的東西:
比如數(shù)據(jù)飛輪應(yīng)該是基于特定領(lǐng)域的know-how或者數(shù)據(jù)來做的,但業(yè)務(wù)流程是不是真的在不斷生產(chǎn)這個領(lǐng)域的知識和數(shù)據(jù)?這件事情你是不是有意識地去做?李彥宏認為,這方面的行業(yè)意識還沒那么強。
同時,他認為數(shù)據(jù)飛輪越簡單越好。因為節(jié)點越多,轉(zhuǎn)起來越慢、越復(fù)雜,每個飛輪的規(guī)模也不大。所以李彥宏希望設(shè)計的少就是多,簡單就是復(fù)雜。
基礎(chǔ)模型至少要在中國領(lǐng)先同行半代
李彥宏認為,目前百度的資源主要聚焦在讓長板更長。至于補短板的時間點,就是當不補短板,長板就成不了的時候。
在他看來,目前百度的資源分配重點有以下幾塊:
基礎(chǔ)模型至少要在中國領(lǐng)先同行半代。百度會繼續(xù)保持對基礎(chǔ)模型的投入;在重點場景上要超過競品,要能為業(yè)務(wù)和產(chǎn)品創(chuàng)造價值,而不是毫無差別地去提升基礎(chǔ)模型的通用能力;
李彥宏解釋新一輪的組織人事調(diào)整
此外,我們也關(guān)注到百度內(nèi)部組織架構(gòu)也迎來了新一輪的調(diào)整。10月8日,百度創(chuàng)始人李彥宏發(fā)出全員郵件,宣布新一輪干部輪崗:百度集團執(zhí)行副總裁羅戎輪崗擔(dān)任移動生態(tài)事業(yè)群組(MEG)負責(zé)人,不再擔(dān)任集團CFO;同時健康事業(yè)群組(HCG)合并至MEG;百度集團資深副總裁何俊杰輪崗擔(dān)任代理CFO,不再擔(dān)任MEG負責(zé)人。
李彥宏對此表示,HCG(健康事業(yè)群組)并入了MEG(移動生態(tài)事業(yè)群),這樣整體效率會更高;內(nèi)容生態(tài)要建設(shè)得足夠穩(wěn)固和有特色,才能做成很多其他工作。比如智能體可以說是“詩和遠方”,但眼下還是要做好用戶心智,讓創(chuàng)作者知道來百度創(chuàng)作或者提交內(nèi)容有什么好處,或者讓用戶感知到在百度上可以看到什么樣的內(nèi)容,或者百度擅長什么樣的內(nèi)容。
而對于ACG(智能云事業(yè)群組),李彥宏則特別給出了規(guī)劃:
首先,ToB業(yè)務(wù)一定要標品化。標品化對應(yīng)的就是項目制,項目制有很多需求,需要派很多駐場人員,要有很多的后臺研發(fā)改造。
像Comate這樣的標準化產(chǎn)品,雖然現(xiàn)在還賣不了多少錢,不夠有競爭力,但李彥宏覺得沒關(guān)系,這種產(chǎn)品的起點比較低也是可以包容的,因為只要持續(xù)的投入,把它的門檻提高,拉大跟競品的差距,未來還是一個好的方向。
其次,ACG要聚焦中腰部的客戶。李彥宏認為,那些可以作為標桿的特大客戶,很多時候從他們身上賺不到什么錢;特別長尾的也不好做——因為手上沒什么錢。