對話華為云馬會彬:AI原生應(yīng)用變革,本質(zhì)上是一場「從1到 0」的創(chuàng)新
嘉賓 | 馬會彬
編輯 | 云昭
出品 | 51CTO技術(shù)棧(微信號:blog51cto)
進(jìn)入2024年,業(yè)界對于生成式AI的注意力開始轉(zhuǎn)向應(yīng)用層。AI編程領(lǐng)域的Cursor、AI生成視頻領(lǐng)域的可靈、自動駕駛領(lǐng)域的Robotaxi等,都取得了很大的突破。據(jù)有關(guān)媒體報道,2024年創(chuàng)投界在AI應(yīng)用層上的投資規(guī)模整體超過了模型層。
這種轉(zhuǎn)變的背后,折射出業(yè)界對于大模型的認(rèn)知發(fā)生了新變化。為什么AI應(yīng)用會成為今年的焦點?
華為云高級技術(shù)專家馬會彬?qū)Υ吮硎?,“這背后是因為僅靠大模型難以實現(xiàn)商業(yè)閉環(huán)?!?/p>
馬會彬認(rèn)為,這一輪大模型所帶來的AI原生應(yīng)用,有著之前的傳統(tǒng)應(yīng)用難以實現(xiàn)的三種關(guān)鍵能力:生成能力、推理能力和自然交互能力,從而產(chǎn)生一類新形態(tài)應(yīng)用,如AI助手類應(yīng)用、具身智能機(jī)器人等。然而,在這場AI原生應(yīng)用變革中,對于組織而言,最大的障礙并不是技術(shù),而是人的思維和認(rèn)知。
“在大模型時代,我們需要從1到0的逆向思考。當(dāng)我們從1到0反向思考,你會發(fā)現(xiàn)通過大模型的技術(shù),有機(jī)會以低成本解決一個高價值的問題的時候,你就會毫不猶豫的去做?!?/p>
而這種逆向思考,在華為云內(nèi)部已經(jīng)成為了AI實踐創(chuàng)新源源不斷的驅(qū)動力。馬會彬告訴我們,在內(nèi)部已經(jīng)形成了“AI First”的文化,同時有專門的組織來負(fù)責(zé)頂層設(shè)計,制定總體目標(biāo)和遵循原則?!霸谶@個頂層設(shè)計之下,所有的部門都要去思考:如何引入和運用AI技術(shù)去解決自己的業(yè)務(wù)問題?!倍趯嵺`層面,華為云也形成了一套“五階八步十二檢查點”的實踐方法論。
在《AIGC實戰(zhàn)派》第20期的直播中,我們與華為云架構(gòu)與技術(shù)創(chuàng)新部高級技術(shù)專家馬會彬圍繞“AI原生應(yīng)用及產(chǎn)品重構(gòu)”長達(dá)150分鐘的深入討論,涉及大模型行業(yè)的投資趨勢、AI原生應(yīng)用變革的現(xiàn)狀、企業(yè)如何切換到AI原生應(yīng)用賽道、華為云內(nèi)部的“AI Fisrt”的實踐思考等。以下是摘取的精彩觀點:
- 我們需要從1到0反向思考,即:如果用大模型做應(yīng)用的話,我會怎么去做?我有哪些本質(zhì)性的變化?創(chuàng)新地方在哪里?
- 傳統(tǒng)軟件開發(fā)是以人為中心的協(xié)同是開發(fā),AI原生軟件是以數(shù)據(jù)為中心的生成式開發(fā)。
- AI原生應(yīng)用,大家要做的是“sell the work!”,交付的是業(yè)務(wù)結(jié)果本身,而非軟件的功能、工具。
- 所有面向內(nèi)容生成的AI場景,不再是以前的編輯器,它是一個AI原生的應(yīng)用,需要按應(yīng)用的邏輯去做。
- 一開始要關(guān)注的不應(yīng)該是準(zhǔn)確率的問題,而是整個系統(tǒng)能不能夠轉(zhuǎn)起來。
- 有一點非常重要,你要逐漸形成自己的整個框架和流程,并保證AI能力是迭代向上的。
- 我們看到有很多的指標(biāo),有人說80%準(zhǔn)確率,有人說90%準(zhǔn)確率,其實背后的東西差異很大,最主要還是根據(jù)自己的情況來選擇。
- 在向AI原生應(yīng)用演進(jìn)時,組織需要思考三個問題:是否需要訓(xùn)練自己的大模型,識別高價值場景,構(gòu)建相應(yīng)的組織和能力。
下面是對話的整理內(nèi)容,供各位翻閱。
1.51CTO:進(jìn)入2024以來,您關(guān)注到最近大模型業(yè)內(nèi)發(fā)生了怎樣的變化?
馬會彬: 宏觀上,我看到一篇報道說今年的創(chuàng)投資金在AI應(yīng)用層的投資規(guī)模超過了大模型這一層,這是一個總體的統(tǒng)計。大家都知道,去年業(yè)界談?wù)摯竽P捅容^多一些,今年可能大家都轉(zhuǎn)向了應(yīng)用這一層。大家逐漸意識到,單獨大模型這一層比較難以實現(xiàn)商業(yè)閉環(huán),因此,整個業(yè)界的注意力就從模型轉(zhuǎn)向場景和應(yīng)用這一層,這是一個整體的趨勢。
從微觀的具體場景上看,今年涌現(xiàn)出了很多AI應(yīng)用層的創(chuàng)新和突破,比如AI輔助編程領(lǐng)域Cursor、國內(nèi)的AI生成視頻應(yīng)用、大模型驅(qū)動的具身智能機(jī)器人等。而且現(xiàn)在有了大量的基于ToC或ToB的AI應(yīng)用,大家開始在日常生活、工作中逐漸使用起來了。
這是一個潛移默化的變化,最后發(fā)生質(zhì)變時可能大家都很難意識到。
2.51CTO:我們?nèi)绾卫斫釧I Native應(yīng)用?
馬會彬:簡單來講,AI Native可以理解為“擬人化”,包括大模型的深度神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)算法, 就是模仿人的大腦的神經(jīng)元及神經(jīng)元的連接機(jī)制;此外,大模型的推理機(jī)制也是擬人化的:生成能力、推理能力和自然交互能力。
這三個能力都是擬人化的“智力”,有了這三個能力之后,首先會出現(xiàn)一批新形態(tài)的應(yīng)用,即大家所說的各種AI助手類的應(yīng)用,又可以分為兩類,一類是面向數(shù)字世界的助手就是我們剛才提到的知識工作者的助手,而第二類就是面向物理世界的助手,即具身智能機(jī)器人;他們都可以實現(xiàn)對人的輔助或者部分代替,人的天性是懶惰的,總有一些不想自己做的事情,就可以交由擬人化的智能設(shè)備、智能應(yīng)用來幫你去做;上面這兩類,我們稱之為AI原生的應(yīng)用。
除了AI原生應(yīng)用,還有一些傳統(tǒng)應(yīng)用,例如原來的CRM、MES等,它們的功能都還存在,比如CRM,原來的訂單功能還在,但是AI會重塑傳統(tǒng)應(yīng)用。任何一個應(yīng)用都可以分解成兩層,比如網(wǎng)銀,它的底層可以被視為一個記錄系統(tǒng),記錄每一筆賬,這個記錄系統(tǒng)是穩(wěn)定的,但是上層的交互系統(tǒng)會被AI重構(gòu)。大家看到大量的前端AI助手類的出現(xiàn),主要是改變了交互和協(xié)同這一層。
AI重構(gòu)的不止傳統(tǒng)的軟件,還包括偏硬件的一些設(shè)備、工具,它們也會疊加一些AI的能力,成為AI使能的產(chǎn)品。
3.51CTO:具身智能也是一個新穎的詞匯,您如何看?
馬會彬:從能力講,具身智能有兩大核心能力,第一個是移動能力,從A點移動到B點,它可以自主尋址,自主移動。另一個是操作和執(zhí)行能力;如果要達(dá)到真正像人一樣,能夠在開放場景、執(zhí)行開放任務(wù),必須有個具身智能的大腦系統(tǒng)。目前相對而言,本體的移動能力已經(jīng)很強(qiáng)了,但現(xiàn)在比較復(fù)雜的兩個點:一個是上肢的精準(zhǔn)協(xié)同和精準(zhǔn)控制,因為操作主要依賴手的靈活性;另一個則是大腦,因為在一個物理空間里面,既要移動,又要執(zhí)行操作,這個挑戰(zhàn)是比純語言模型復(fù)雜許多。
4.51CTO:回過頭來,我們?nèi)绾慰创@波大模型技術(shù)對行業(yè)帶來的影響?
馬會彬: 現(xiàn)在的大模型,跟之前的AI模型相比,在架構(gòu)上有著本質(zhì)的區(qū)別。因此業(yè)界也通常分為“判別式AI / 經(jīng)典AI”跟“生成式AI”。
此外,模型的場景泛化能力也有著有很大的差別。相對來講,經(jīng)典AI一般都是針對一個特定的場景,用精準(zhǔn)的標(biāo)注數(shù)據(jù)去做訓(xùn)練,而大模型是面向通用的場景使用非標(biāo)注數(shù)據(jù)訓(xùn)練。
所以現(xiàn)在需要大家對當(dāng)前的軟件、工具、算法進(jìn)行反向思考,也就是“從1到0的反向創(chuàng)新”。之前比較多的是從0到1去構(gòu)建一個新的東西,但現(xiàn)在的話,無論是工具、軟件還是其他,日常需要用到的東西基本上都有。所以,在大模型出來之后,需要反向從1到0思考,如果用大模型來重構(gòu)的話,我會怎么去做?有哪些本質(zhì)性的變化?創(chuàng)新的地方在哪里?
在逆向思考的過程中,就會發(fā)現(xiàn)很多有趣的問題:原來可能比較復(fù)雜的,比較困難,或者是說成本比較高的障礙,也許用了新的方式之后,就不再是障礙了。
譬如乘用車的自動駕駛,就是一個比較經(jīng)典的例子。乘用車自動駕駛在此前很多年,一直沒有太大突破?,F(xiàn)在大模型出來之后,很快就在自動駕駛領(lǐng)域涌現(xiàn)出了端到端的神經(jīng)網(wǎng)絡(luò)大模型,比如VLM、VLA。它本質(zhì)上也是擬人化的,因為它不再是通過基于感知、規(guī)劃等一個個小算法去寫車輛的操控動作,這種模式有一個很大的問題,就是現(xiàn)實中算法要應(yīng)對的場景特別多,你會發(fā)現(xiàn)算法中corner case和bad case根本枚舉不完,很難提升到更高級別的智駕能力。
切換到端到端的大模型解決方案以后,很快就發(fā)生了本質(zhì)的變化,它可以擬人化地學(xué)習(xí)人的感知和操控,通過大規(guī)模的數(shù)據(jù)訓(xùn)練,不需要再去考慮corner case、bad case就能學(xué)習(xí)到通用方法。例如特斯拉宣稱FSD v12基于端到端的神經(jīng)網(wǎng)絡(luò)大模型方案,不僅減少了30萬行C++代碼,而且,整體的駕駛能力和水平也有了本質(zhì)的提升。v12版本之前,基于小模型算法的方案,其自動駕駛的使用增長曲線是比較平的,而v12之后,這條曲線就變得非常陡峭。
以此類比,其他的業(yè)務(wù)、應(yīng)用也有很多采用大模型的方法進(jìn)行重構(gòu)后,應(yīng)用的價值增值也非常顯著,據(jù)業(yè)界一個統(tǒng)計,一些軟件的可能增加了100%甚至120%的新價值。
所以,當(dāng)發(fā)現(xiàn)“從1到0”反向思考當(dāng)前的業(yè)務(wù),就有機(jī)會以低成本解決一個高價值的問題的時候,就會毫不猶豫的去做。
5.51CTO:大模型作為確定性的趨勢,那么切換到這條賽道上,企業(yè)還有哪些關(guān)鍵問題需要考慮?
馬會彬: 放到企業(yè)視角來講的話,我認(rèn)為需要思考三個根本的問題。
首先,一個公司或組織需要考慮是否需要訓(xùn)練自己的大模型,是從零開始訓(xùn)練,還是基于已有的模型為基座來做增量訓(xùn)練、后訓(xùn)練或調(diào)優(yōu),這跟你的業(yè)務(wù)特征和私域數(shù)據(jù)有很大的關(guān)系。
第二個問題,則是要識別出行業(yè)的高價值場景。對于組織或行業(yè)來講,AI改變它的場景是什么?這是要去思考和定義的。
第三個則是組織和能力的問題,就是需要怎樣的組織和能力匹配這個戰(zhàn)略。
這三個問題如果都有答案了,就可以去具體評估原來業(yè)務(wù)中哪些依然是有效的,哪些需要被重塑的。
業(yè)界講“優(yōu)勢抵不過趨勢”,大模型是確定性的確實,我們肯定要順應(yīng)趨勢去看。當(dāng)然,企業(yè)內(nèi)部其實還是需要有一些框架和方法論的東西來指導(dǎo),因為實際可投入的資源總是有限的。
所以,在業(yè)務(wù)中引入大模型,具體怎么去落地,相對來講是一個比較嚴(yán)謹(jǐn)?shù)氖虑?。在華為云內(nèi)部,我們是有相關(guān)的方法論和框架來輔助客戶去做決策、評估、場景選擇等,它并不是說完全一個拍腦袋的事情。
6.51CTO:在華為云內(nèi)部,是如何考慮怎樣引入這場AI原生變革的?
馬會彬:概括來講可以分為兩層,第一層我們稱為確立AI First 的思維范式。在公司內(nèi)部,提供了相關(guān)的學(xué)習(xí)、培訓(xùn),而且從部門、組織的角度都要去思考“all in ai”這件事情在自己的業(yè)務(wù)領(lǐng)域上要怎么去做,如何用 AI Native 的技術(shù)和方法來重構(gòu)業(yè)務(wù)、重塑流程;第二層,我們稱之為AI Native的落地實踐,剛才我提到了用于指導(dǎo)實踐的方法論,即“五階八步十二檢查點”,比較系統(tǒng)詳細(xì),這里就不詳細(xì)展開講了。
在華為內(nèi)部,華為云作為內(nèi)部管理和各產(chǎn)業(yè)的底座平臺,會為內(nèi)部的研、產(chǎn)、供、銷、服、行政、后勤、財經(jīng)等提供技術(shù)平臺。這些部門利用華為云的平臺和技術(shù)就積累了大量的場景化業(yè)務(wù)資產(chǎn),我們把這些資產(chǎn)稱為“經(jīng)驗”。
現(xiàn)在華為云的aPaaS,定位就是“經(jīng)驗即服務(wù),讓優(yōu)秀得以復(fù)制”。目標(biāo)就是將其中可以被重用的部分場景化業(yè)務(wù)資產(chǎn)進(jìn)行產(chǎn)品化,服務(wù)于我們的內(nèi)外部客戶。我們在AI實踐方面開始得比較早,我們希望能夠把內(nèi)部積累的AI經(jīng)驗及成果提供給客戶和伙伴。
7.51CTO:從業(yè)務(wù)視角上看,如何思考“現(xiàn)在的應(yīng)用都值得重新做一遍”?
馬會彬: 業(yè)界很多大佬都有類似的說法,從趨勢和方向性來講確實如此。但作為架構(gòu)師,首先要問why 和 how 的問題,即為什么要重做一遍,以及如何去重新做一遍;我覺得可以從業(yè)務(wù)視角和技術(shù)視角兩個維度去分析。
從業(yè)務(wù)視角講,就是改變了傳統(tǒng)軟件的交付和使用方式,以及軟件的商業(yè)模式。之前的軟件不管是哪一種類型,HR軟件也好、PS軟件也好,都是工具軟件,即需要專業(yè)的人去操作這個軟件才可能完成業(yè)務(wù)功能。然而,這里的操作有相當(dāng)?shù)拈T檻要求,必須是行業(yè)或領(lǐng)域的專業(yè)人才或者專家,必須接受一定的培訓(xùn)學(xué)習(xí)才能完成。
基于大模型的軟件系統(tǒng)提供的則是“sell the work!”,交付的是業(yè)務(wù)結(jié)果本身,而非software。
大模型是知識和經(jīng)驗的壓縮,如果能把領(lǐng)域頂級專家的經(jīng)驗和知識壓縮到模型里面,或者內(nèi)化到AI原生的應(yīng)用中,它能否在一定程度上代替這個專家完成對應(yīng)的操作?所以交付的不再是一個工具,而是更直接的業(yè)務(wù)結(jié)果。
例如一個畫圖軟件,以前你必須得畫才能得到作品,現(xiàn)在你只需要告訴你要什么東西,它直接給你生成了。再比如自動駕駛的例子,現(xiàn)在已經(jīng)出現(xiàn)“出行即服務(wù)”的案例。
8.51CTO:華為云具體是如何通過aPaaS賦能AI原生應(yīng)用的,它提供了哪些服務(wù)和能力?
馬會彬:我先簡要介紹一下華為云的服務(wù)構(gòu)成,這樣大家就能理解華為從全棧的角度是如何構(gòu)思的。華為云的slogan就 “一切皆服務(wù)”(Everything is Service),可以分為三層。第一層是基礎(chǔ)設(shè)施即服務(wù),就是常說的IaaS,這個大家比較熟悉。第二層是技術(shù)即服務(wù),即PaaS,包括數(shù)據(jù)庫、中間件、大數(shù)據(jù),以及AI大模型等。基礎(chǔ)設(shè)施即服務(wù)和技術(shù)即服務(wù)都是相對標(biāo)準(zhǔn)化的產(chǎn)品,而第三層“經(jīng)驗即服務(wù)”,更靠近業(yè)務(wù)場景。中文的“經(jīng)驗”一詞,英文可以對應(yīng)到兩個詞:一個是 “expertise”,就是解決某一個問題的能力,另外一個詞即“experience”,就是有沒有經(jīng)歷過一件事情,中國人常說“行萬里路”等,你對一個事情的實踐就是“experience”,這兩方面加起來才是“經(jīng)驗”的核心。
那么,華為云的“經(jīng)驗即服務(wù)”中的經(jīng)驗從哪里來?它的構(gòu)成是什么?第一個來源就是華為的內(nèi)部實踐;第二個來源是來自于生態(tài)伙伴?!敖?jīng)驗即服務(wù)”從產(chǎn)品構(gòu)成來講可以分為三層,第一層是AppStage應(yīng)用平臺,這是一個圍繞應(yīng)用生命周期的一站式開發(fā)管理平臺。業(yè)界有個專業(yè)名詞叫IDP(Internal Development Platform),就是所有大型組織在做研發(fā)的時候都有一個內(nèi)部公共平臺,因為在工具鏈之上,還會有架構(gòu)規(guī)范、技術(shù)規(guī)范、安全加固規(guī)范等,而要把這些規(guī)范落實到具體的開發(fā)活動中,就必須把它內(nèi)化到的研發(fā)流程、預(yù)定義模板、框架包等各種細(xì)節(jié)中去。
這個平臺承載了圍繞應(yīng)用構(gòu)建、開發(fā)、測試等一系列活動的build-in經(jīng)驗資產(chǎn)。在這個平臺之上,有三類不同的應(yīng)用對象,分別為IT應(yīng)用、移動APP應(yīng)用、以及現(xiàn)在的AI原生應(yīng)用。面向這三個不同應(yīng)用,在AppStage平臺上構(gòu)建了兩個引擎,一個是AI原生的應(yīng)用引擎,就是面向AI原生應(yīng)用的工程體系,包括模型中心、知識中心、Agent構(gòu)建、安全合規(guī)能力,此外還有一些內(nèi)化的經(jīng)驗資產(chǎn),比如模型、數(shù)據(jù)、意圖識別等的經(jīng)驗化等。其二,就是AI原生數(shù)據(jù)引擎,即如何把企業(yè)結(jié)構(gòu)化的和非結(jié)構(gòu)化的數(shù)據(jù),轉(zhuǎn)換成使用戶大模型及AI應(yīng)用所能夠消費和使用的知識。
在這個平臺之上,我們有基于業(yè)務(wù)場景化資產(chǎn)孵化的6個Koo系列產(chǎn)品,包括KooPhone、KooDrive、KooMessage等,它們也是首先進(jìn)行AI原生化重塑的,因此也就具備了AI原生的智能營銷、AI原生的云終端、AI原生的內(nèi)容中樞等。
第三層是面向行業(yè)的場景化資產(chǎn),我們也稱為“行業(yè)aPaaS”,目前有面向政務(wù)的事件中心、面向園區(qū)、設(shè)施管理的設(shè)施aPaaS等。
9.51CTO:在華為云內(nèi)部是怎樣為AI應(yīng)用設(shè)定進(jìn)一步推廣的準(zhǔn)確率標(biāo)準(zhǔn)的?
馬會彬:現(xiàn)在的做法是不直接使用準(zhǔn)確率或滿意度這兩個指標(biāo),因為它們都比較難以準(zhǔn)確評估。比如你說準(zhǔn)確率要達(dá)到60%才算可以,但60%到底是高還是低,其實跟具體場景是密切相關(guān)的。
所以現(xiàn)在往往用采納率來度量,比如以生成JD(Job Description)為例,你生成的JD有多少比例被接納了,這些數(shù)據(jù)都是容易被統(tǒng)計的,更能真實地反映AI應(yīng)用達(dá)成的效果。通常會跟一個業(yè)務(wù)平均水平高一點的人去類比,來看這個結(jié)果到底是不是達(dá)到一個比較理想的狀態(tài)。
另外它是有一定的容忍度的,并不追求百分之百的準(zhǔn)確。而是達(dá)到一個參照水平,從業(yè)務(wù)上來講能夠帶來正向作用,達(dá)到業(yè)務(wù)結(jié)果的最終使用方或者內(nèi)部可接受的程度就可以了。
所以,還是根據(jù)實際情況來評估。也許對某些場景來說,要99%的準(zhǔn)確率才可以,但對某些場景來說,可能50%或60%就已經(jīng)足夠了。我們只要確定一點,就是系統(tǒng)整體是迭代向上的,這是非常關(guān)鍵的。因此最重要的是盡早構(gòu)建整個AI應(yīng)用的框架和質(zhì)量流程,使AI作業(yè)能夠迭代優(yōu)化起來。
總結(jié)來說,第一步關(guān)注的不應(yīng)該是準(zhǔn)確率的問題,更需要注意的是整個系統(tǒng)能不能夠持續(xù)迭代起來。第二步,在持續(xù)迭代起來的時候,能不能準(zhǔn)確地找到系統(tǒng)里面的關(guān)鍵問題或者說關(guān)鍵優(yōu)化點,圍繞數(shù)據(jù)、模型、工程、前端、企業(yè)應(yīng)用等有很多方面,到底哪個點是高價值部分,是自己可以控制的,這很關(guān)鍵。
很多人一開始可能會犯一個錯誤,就是看這個準(zhǔn)確率不高,然后可能就放棄了,但其實找到那個能讓AI應(yīng)用持續(xù)改進(jìn)的關(guān)鍵點,進(jìn)行持續(xù)迭代優(yōu)化才是最重要的。
本文轉(zhuǎn)載自??51CTO技術(shù)棧??,作者:云昭
