嘉賓 | 馬會彬
編輯 | 云昭
出品 | 51CTO技術棧(微信號:blog51cto)
進入2024年,業(yè)界對于生成式AI的注意力開始轉向應用層。AI編程領域的Cursor、AI生成視頻領域的可靈、自動駕駛領域的Robotaxi等,都取得了很大的突破。據(jù)有關媒體報道,2024年創(chuàng)投界在AI應用層上的投資規(guī)模整體超過了模型層。
這種轉變的背后,折射出業(yè)界對于大模型的認知發(fā)生了新變化。為什么AI應用會成為今年的焦點?
華為云高級技術專家馬會彬對此表示,“這背后是因為僅靠大模型難以實現(xiàn)商業(yè)閉環(huán)?!?/p>
馬會彬認為,這一輪大模型所帶來的AI原生應用,有著之前的傳統(tǒng)應用難以實現(xiàn)的三種關鍵能力:生成能力、推理能力和自然交互能力,從而產(chǎn)生一類新形態(tài)應用,如AI助手類應用、具身智能機器人等。然而,在這場AI原生應用變革中,對于組織而言,最大的障礙并不是技術,而是人的思維和認知。
“在大模型時代,我們需要從1到0的逆向思考。當我們從1到0反向思考,你會發(fā)現(xiàn)通過大模型的技術,有機會以低成本解決一個高價值的問題的時候,你就會毫不猶豫的去做?!?/p>
而這種逆向思考,在華為云內部已經(jīng)成為了AI實踐創(chuàng)新源源不斷的驅動力。馬會彬告訴我們,在內部已經(jīng)形成了“AI First”的文化,同時有專門的組織來負責頂層設計,制定總體目標和遵循原則。“在這個頂層設計之下,所有的部門都要去思考:如何引入和運用AI技術去解決自己的業(yè)務問題?!倍趯嵺`層面,華為云也形成了一套“五階八步十二檢查點”的實踐方法論。
在《AIGC實戰(zhàn)派》第20期的直播中,我們與華為云架構與技術創(chuàng)新部高級技術專家馬會彬圍繞“AI原生應用及產(chǎn)品重構”長達150分鐘的深入討論,涉及大模型行業(yè)的投資趨勢、AI原生應用變革的現(xiàn)狀、企業(yè)如何切換到AI原生應用賽道、華為云內部的“AI Fisrt”的實踐思考等。以下是摘取的精彩觀點:
- 我們需要從1到0反向思考,即:如果用大模型做應用的話,我會怎么去做?我有哪些本質性的變化?創(chuàng)新地方在哪里?
- 傳統(tǒng)軟件開發(fā)是以人為中心的協(xié)同是開發(fā),AI原生軟件是以數(shù)據(jù)為中心的生成式開發(fā)。
- AI原生應用,大家要做的是“sell the work!”,交付的是業(yè)務結果本身,而非軟件的功能、工具。
- 所有面向內容生成的AI場景,不再是以前的編輯器,它是一個AI原生的應用,需要按應用的邏輯去做。
- 一開始要關注的不應該是準確率的問題,而是整個系統(tǒng)能不能夠轉起來。
- 有一點非常重要,你要逐漸形成自己的整個框架和流程,并保證AI能力是迭代向上的。
- 我們看到有很多的指標,有人說80%準確率,有人說90%準確率,其實背后的東西差異很大,最主要還是根據(jù)自己的情況來選擇。
- 在向AI原生應用演進時,組織需要思考三個問題:是否需要訓練自己的大模型,識別高價值場景,構建相應的組織和能力。
下面是對話的整理內容,供各位翻閱。
1.51CTO:進入2024以來,您關注到最近大模型業(yè)內發(fā)生了怎樣的變化?
馬會彬: 宏觀上,我看到一篇報道說今年的創(chuàng)投資金在AI應用層的投資規(guī)模超過了大模型這一層,這是一個總體的統(tǒng)計。大家都知道,去年業(yè)界談論大模型比較多一些,今年可能大家都轉向了應用這一層。大家逐漸意識到,單獨大模型這一層比較難以實現(xiàn)商業(yè)閉環(huán),因此,整個業(yè)界的注意力就從模型轉向場景和應用這一層,這是一個整體的趨勢。
從微觀的具體場景上看,今年涌現(xiàn)出了很多AI應用層的創(chuàng)新和突破,比如AI輔助編程領域Cursor、國內的AI生成視頻應用、大模型驅動的具身智能機器人等。而且現(xiàn)在有了大量的基于ToC或ToB的AI應用,大家開始在日常生活、工作中逐漸使用起來了。
這是一個潛移默化的變化,最后發(fā)生質變時可能大家都很難意識到。
2.51CTO:我們如何理解AI Native應用?
馬會彬:簡單來講,AI Native可以理解為“擬人化”,包括大模型的深度神經(jīng)網(wǎng)絡、深度學習算法, 就是模仿人的大腦的神經(jīng)元及神經(jīng)元的連接機制;此外,大模型的推理機制也是擬人化的:生成能力、推理能力和自然交互能力。
這三個能力都是擬人化的“智力”,有了這三個能力之后,首先會出現(xiàn)一批新形態(tài)的應用,即大家所說的各種AI助手類的應用,又可以分為兩類,一類是面向數(shù)字世界的助手就是我們剛才提到的知識工作者的助手,而第二類就是面向物理世界的助手,即具身智能機器人;他們都可以實現(xiàn)對人的輔助或者部分代替,人的天性是懶惰的,總有一些不想自己做的事情,就可以交由擬人化的智能設備、智能應用來幫你去做;上面這兩類,我們稱之為AI原生的應用。
除了AI原生應用,還有一些傳統(tǒng)應用,例如原來的CRM、MES等,它們的功能都還存在,比如CRM,原來的訂單功能還在,但是AI會重塑傳統(tǒng)應用。任何一個應用都可以分解成兩層,比如網(wǎng)銀,它的底層可以被視為一個記錄系統(tǒng),記錄每一筆賬,這個記錄系統(tǒng)是穩(wěn)定的,但是上層的交互系統(tǒng)會被AI重構。大家看到大量的前端AI助手類的出現(xiàn),主要是改變了交互和協(xié)同這一層。
AI重構的不止傳統(tǒng)的軟件,還包括偏硬件的一些設備、工具,它們也會疊加一些AI的能力,成為AI使能的產(chǎn)品。
3.51CTO:具身智能也是一個新穎的詞匯,您如何看?
馬會彬:從能力講,具身智能有兩大核心能力,第一個是移動能力,從A點移動到B點,它可以自主尋址,自主移動。另一個是操作和執(zhí)行能力;如果要達到真正像人一樣,能夠在開放場景、執(zhí)行開放任務,必須有個具身智能的大腦系統(tǒng)。目前相對而言,本體的移動能力已經(jīng)很強了,但現(xiàn)在比較復雜的兩個點:一個是上肢的精準協(xié)同和精準控制,因為操作主要依賴手的靈活性;另一個則是大腦,因為在一個物理空間里面,既要移動,又要執(zhí)行操作,這個挑戰(zhàn)是比純語言模型復雜許多。
4.51CTO:回過頭來,我們如何看待這波大模型技術對行業(yè)帶來的影響?
馬會彬: 現(xiàn)在的大模型,跟之前的AI模型相比,在架構上有著本質的區(qū)別。因此業(yè)界也通常分為“判別式AI / 經(jīng)典AI”跟“生成式AI”。
此外,模型的場景泛化能力也有著有很大的差別。相對來講,經(jīng)典AI一般都是針對一個特定的場景,用精準的標注數(shù)據(jù)去做訓練,而大模型是面向通用的場景使用非標注數(shù)據(jù)訓練。
所以現(xiàn)在需要大家對當前的軟件、工具、算法進行反向思考,也就是“從1到0的反向創(chuàng)新”。之前比較多的是從0到1去構建一個新的東西,但現(xiàn)在的話,無論是工具、軟件還是其他,日常需要用到的東西基本上都有。所以,在大模型出來之后,需要反向從1到0思考,如果用大模型來重構的話,我會怎么去做?有哪些本質性的變化?創(chuàng)新的地方在哪里?
在逆向思考的過程中,就會發(fā)現(xiàn)很多有趣的問題:原來可能比較復雜的,比較困難,或者是說成本比較高的障礙,也許用了新的方式之后,就不再是障礙了。
譬如乘用車的自動駕駛,就是一個比較經(jīng)典的例子。乘用車自動駕駛在此前很多年,一直沒有太大突破?,F(xiàn)在大模型出來之后,很快就在自動駕駛領域涌現(xiàn)出了端到端的神經(jīng)網(wǎng)絡大模型,比如VLM、VLA。它本質上也是擬人化的,因為它不再是通過基于感知、規(guī)劃等一個個小算法去寫車輛的操控動作,這種模式有一個很大的問題,就是現(xiàn)實中算法要應對的場景特別多,你會發(fā)現(xiàn)算法中corner case和bad case根本枚舉不完,很難提升到更高級別的智駕能力。
切換到端到端的大模型解決方案以后,很快就發(fā)生了本質的變化,它可以擬人化地學習人的感知和操控,通過大規(guī)模的數(shù)據(jù)訓練,不需要再去考慮corner case、bad case就能學習到通用方法。例如特斯拉宣稱FSD v12基于端到端的神經(jīng)網(wǎng)絡大模型方案,不僅減少了30萬行C++代碼,而且,整體的駕駛能力和水平也有了本質的提升。v12版本之前,基于小模型算法的方案,其自動駕駛的使用增長曲線是比較平的,而v12之后,這條曲線就變得非常陡峭。
以此類比,其他的業(yè)務、應用也有很多采用大模型的方法進行重構后,應用的價值增值也非常顯著,據(jù)業(yè)界一個統(tǒng)計,一些軟件的可能增加了100%甚至120%的新價值。
所以,當發(fā)現(xiàn)“從1到0”反向思考當前的業(yè)務,就有機會以低成本解決一個高價值的問題的時候,就會毫不猶豫的去做。
5.51CTO:大模型作為確定性的趨勢,那么切換到這條賽道上,企業(yè)還有哪些關鍵問題需要考慮?
馬會彬: 放到企業(yè)視角來講的話,我認為需要思考三個根本的問題。
首先,一個公司或組織需要考慮是否需要訓練自己的大模型,是從零開始訓練,還是基于已有的模型為基座來做增量訓練、后訓練或調優(yōu),這跟你的業(yè)務特征和私域數(shù)據(jù)有很大的關系。
第二個問題,則是要識別出行業(yè)的高價值場景。對于組織或行業(yè)來講,AI改變它的場景是什么?這是要去思考和定義的。
第三個則是組織和能力的問題,就是需要怎樣的組織和能力匹配這個戰(zhàn)略。
這三個問題如果都有答案了,就可以去具體評估原來業(yè)務中哪些依然是有效的,哪些需要被重塑的。
業(yè)界講“優(yōu)勢抵不過趨勢”,大模型是確定性的確實,我們肯定要順應趨勢去看。當然,企業(yè)內部其實還是需要有一些框架和方法論的東西來指導,因為實際可投入的資源總是有限的。
所以,在業(yè)務中引入大模型,具體怎么去落地,相對來講是一個比較嚴謹?shù)氖虑?。在華為云內部,我們是有相關的方法論和框架來輔助客戶去做決策、評估、場景選擇等,它并不是說完全一個拍腦袋的事情。
6.51CTO:在華為云內部,是如何考慮怎樣引入這場AI原生變革的?
馬會彬:概括來講可以分為兩層,第一層我們稱為確立AI First 的思維范式。在公司內部,提供了相關的學習、培訓,而且從部門、組織的角度都要去思考“all in ai”這件事情在自己的業(yè)務領域上要怎么去做,如何用 AI Native 的技術和方法來重構業(yè)務、重塑流程;第二層,我們稱之為AI Native的落地實踐,剛才我提到了用于指導實踐的方法論,即“五階八步十二檢查點”,比較系統(tǒng)詳細,這里就不詳細展開講了。
在華為內部,華為云作為內部管理和各產(chǎn)業(yè)的底座平臺,會為內部的研、產(chǎn)、供、銷、服、行政、后勤、財經(jīng)等提供技術平臺。這些部門利用華為云的平臺和技術就積累了大量的場景化業(yè)務資產(chǎn),我們把這些資產(chǎn)稱為“經(jīng)驗”。
現(xiàn)在華為云的aPaaS,定位就是“經(jīng)驗即服務,讓優(yōu)秀得以復制”。目標就是將其中可以被重用的部分場景化業(yè)務資產(chǎn)進行產(chǎn)品化,服務于我們的內外部客戶。我們在AI實踐方面開始得比較早,我們希望能夠把內部積累的AI經(jīng)驗及成果提供給客戶和伙伴。
7.51CTO:從業(yè)務視角上看,如何思考“現(xiàn)在的應用都值得重新做一遍”?
馬會彬: 業(yè)界很多大佬都有類似的說法,從趨勢和方向性來講確實如此。但作為架構師,首先要問why 和 how 的問題,即為什么要重做一遍,以及如何去重新做一遍;我覺得可以從業(yè)務視角和技術視角兩個維度去分析。
從業(yè)務視角講,就是改變了傳統(tǒng)軟件的交付和使用方式,以及軟件的商業(yè)模式。之前的軟件不管是哪一種類型,HR軟件也好、PS軟件也好,都是工具軟件,即需要專業(yè)的人去操作這個軟件才可能完成業(yè)務功能。然而,這里的操作有相當?shù)拈T檻要求,必須是行業(yè)或領域的專業(yè)人才或者專家,必須接受一定的培訓學習才能完成。
基于大模型的軟件系統(tǒng)提供的則是“sell the work!”,交付的是業(yè)務結果本身,而非software。
大模型是知識和經(jīng)驗的壓縮,如果能把領域頂級專家的經(jīng)驗和知識壓縮到模型里面,或者內化到AI原生的應用中,它能否在一定程度上代替這個專家完成對應的操作?所以交付的不再是一個工具,而是更直接的業(yè)務結果。
例如一個畫圖軟件,以前你必須得畫才能得到作品,現(xiàn)在你只需要告訴你要什么東西,它直接給你生成了。再比如自動駕駛的例子,現(xiàn)在已經(jīng)出現(xiàn)“出行即服務”的案例。
8.51CTO:華為云具體是如何通過aPaaS賦能AI原生應用的,它提供了哪些服務和能力?
馬會彬:我先簡要介紹一下華為云的服務構成,這樣大家就能理解華為從全棧的角度是如何構思的。華為云的slogan就 “一切皆服務”(Everything is Service),可以分為三層。第一層是基礎設施即服務,就是常說的IaaS,這個大家比較熟悉。第二層是技術即服務,即PaaS,包括數(shù)據(jù)庫、中間件、大數(shù)據(jù),以及AI大模型等?;A設施即服務和技術即服務都是相對標準化的產(chǎn)品,而第三層“經(jīng)驗即服務”,更靠近業(yè)務場景。中文的“經(jīng)驗”一詞,英文可以對應到兩個詞:一個是 “expertise”,就是解決某一個問題的能力,另外一個詞即“experience”,就是有沒有經(jīng)歷過一件事情,中國人常說“行萬里路”等,你對一個事情的實踐就是“experience”,這兩方面加起來才是“經(jīng)驗”的核心。
那么,華為云的“經(jīng)驗即服務”中的經(jīng)驗從哪里來?它的構成是什么?第一個來源就是華為的內部實踐;第二個來源是來自于生態(tài)伙伴?!敖?jīng)驗即服務”從產(chǎn)品構成來講可以分為三層,第一層是AppStage應用平臺,這是一個圍繞應用生命周期的一站式開發(fā)管理平臺。業(yè)界有個專業(yè)名詞叫IDP(Internal Development Platform),就是所有大型組織在做研發(fā)的時候都有一個內部公共平臺,因為在工具鏈之上,還會有架構規(guī)范、技術規(guī)范、安全加固規(guī)范等,而要把這些規(guī)范落實到具體的開發(fā)活動中,就必須把它內化到的研發(fā)流程、預定義模板、框架包等各種細節(jié)中去。
這個平臺承載了圍繞應用構建、開發(fā)、測試等一系列活動的build-in經(jīng)驗資產(chǎn)。在這個平臺之上,有三類不同的應用對象,分別為IT應用、移動APP應用、以及現(xiàn)在的AI原生應用。面向這三個不同應用,在AppStage平臺上構建了兩個引擎,一個是AI原生的應用引擎,就是面向AI原生應用的工程體系,包括模型中心、知識中心、Agent構建、安全合規(guī)能力,此外還有一些內化的經(jīng)驗資產(chǎn),比如模型、數(shù)據(jù)、意圖識別等的經(jīng)驗化等。其二,就是AI原生數(shù)據(jù)引擎,即如何把企業(yè)結構化的和非結構化的數(shù)據(jù),轉換成使用戶大模型及AI應用所能夠消費和使用的知識。
在這個平臺之上,我們有基于業(yè)務場景化資產(chǎn)孵化的6個Koo系列產(chǎn)品,包括KooPhone、KooDrive、KooMessage等,它們也是首先進行AI原生化重塑的,因此也就具備了AI原生的智能營銷、AI原生的云終端、AI原生的內容中樞等。
第三層是面向行業(yè)的場景化資產(chǎn),我們也稱為“行業(yè)aPaaS”,目前有面向政務的事件中心、面向園區(qū)、設施管理的設施aPaaS等。
9.51CTO:在華為云內部是怎樣為AI應用設定進一步推廣的準確率標準的?
馬會彬:現(xiàn)在的做法是不直接使用準確率或滿意度這兩個指標,因為它們都比較難以準確評估。比如你說準確率要達到60%才算可以,但60%到底是高還是低,其實跟具體場景是密切相關的。
所以現(xiàn)在往往用采納率來度量,比如以生成JD(Job Description)為例,你生成的JD有多少比例被接納了,這些數(shù)據(jù)都是容易被統(tǒng)計的,更能真實地反映AI應用達成的效果。通常會跟一個業(yè)務平均水平高一點的人去類比,來看這個結果到底是不是達到一個比較理想的狀態(tài)。
另外它是有一定的容忍度的,并不追求百分之百的準確。而是達到一個參照水平,從業(yè)務上來講能夠帶來正向作用,達到業(yè)務結果的最終使用方或者內部可接受的程度就可以了。
所以,還是根據(jù)實際情況來評估。也許對某些場景來說,要99%的準確率才可以,但對某些場景來說,可能50%或60%就已經(jīng)足夠了。我們只要確定一點,就是系統(tǒng)整體是迭代向上的,這是非常關鍵的。因此最重要的是盡早構建整個AI應用的框架和質量流程,使AI作業(yè)能夠迭代優(yōu)化起來。
總結來說,第一步關注的不應該是準確率的問題,更需要注意的是整個系統(tǒng)能不能夠持續(xù)迭代起來。第二步,在持續(xù)迭代起來的時候,能不能準確地找到系統(tǒng)里面的關鍵問題或者說關鍵優(yōu)化點,圍繞數(shù)據(jù)、模型、工程、前端、企業(yè)應用等有很多方面,到底哪個點是高價值部分,是自己可以控制的,這很關鍵。
很多人一開始可能會犯一個錯誤,就是看這個準確率不高,然后可能就放棄了,但其實找到那個能讓AI應用持續(xù)改進的關鍵點,進行持續(xù)迭代優(yōu)化才是最重要的。


2018-09-17 16:46:17




