嘉賓 | 周明
撰稿 | 云昭
一夕湘沅春水來,浩浩蕩蕩無際涯。一夜之間,ChatGPT 點燃了全世界的創(chuàng)新熱情。這個被寄予無限期望的新引擎,成為賽道上眾多玩家爭相布局的重點一環(huán)。
在賽道旁“遠觀”,只能聽見浩大的聲勢,卻不能探究它真正的魅力。正所謂“共駭群龍水上游,不知原是木蘭舟?!鼻Х偘l(fā)的背后,弄潮兒們是如何駕馭大模型的?挑戰(zhàn)和機遇如何?在一個個真實的使用場景中,怎樣才能扎實落地和賦能千行百業(yè)?
基于此,我們懷揣著求實的心情,有幸采訪到“大模型實力派”瀾舟科技的創(chuàng)始人兼 CEO、中國計算機學(xué)會 CCF 副理事長、創(chuàng)新工場首席科學(xué)家周明。
提起周明老師,AI界無人不曉。作為聲名卓著的世界級科學(xué)家,在完成了21年的微軟亞洲研究院的工作之旅后,他加入李開復(fù)的創(chuàng)新工場,孵化了瀾舟科技,成為了一名投身大模型領(lǐng)域的技術(shù)“創(chuàng)客”。
1、大模型是一件困難但重要的事情
國外興起一個新的事物、新的技術(shù),國內(nèi)就蜂擁而上、躍躍欲試,這種現(xiàn)象屢見不鮮。追捧也好、挑戰(zhàn)也好、自嗨也好,很多團隊都加入了,包括大廠、創(chuàng)業(yè)團隊,甚至包括很多政府的科研機構(gòu),甚至包括普通的用戶。
這本身是一個好事情,這說明中國對新技術(shù)的追求和自驅(qū)能力。然而,周明表示,這里要留意一個泡沫問題?;ㄙM大力氣去煉一個要好不賴的模型,誠然對自己是一個學(xué)習(xí)鍛煉的過程,但對社會可能不一定直接有用。拿它去創(chuàng)業(yè),也可能會白白浪費了很多創(chuàng)業(yè)的資本和投入。
“大家要面向自己的能力,選好不同的賽道”,在周明看來,量力而行,選擇適合自己的才是正解。比如,賽道不止 to C 和 to B,to Developer 也可能是一個賽道。不同的公司、不同的團隊有著不同的基因,針對你的基因來選擇不同的賽道,做出一個適合企業(yè)和個人自身的發(fā)展之路。
這當中就需要審時度勢,有的時候可能到一定程度你要放棄,你要尋找下一個新的機會。但是無論怎么樣,頭腦要保持住新鮮的思維,保持自驅(qū)力和內(nèi)省,接受各種批評,不斷地調(diào)整自我,從而一點點回歸到適合于自身發(fā)展的方向。
2、to B 與 to C 如何選擇
進入大模型時代,產(chǎn)品/服務(wù)選擇上,到底該做 B 端還是 C 端呢?這是困擾入場者很大的一個問題。
“to B、to C對模型的要求,對算力的要求,以及研發(fā)的重點是不一樣的?!敝苊鹘酉聛斫o出了解釋。
他認為,相較而言to C 產(chǎn)品難度很大。如果要跟 OpenAI 對標,那就一定要做到很強的 AGI 能力,硬件上一兩千塊卡可能都少了,五千到一萬塊卡才能形成強競爭力,而且難度堪比“千軍萬馬過獨木橋”,光做出來還遠遠不夠,還要比別人做得更好,而且別人也在前進。所以,C 端產(chǎn)品,實際上是一個軍備競賽的過程。
而 to B 則不同,可能訓(xùn)練一個百億到千億的模型就足夠了,因為 to B 主要考驗的是用戶的語言理解和多輪對話能力。周明進一步透露,500塊上下的卡,能夠很好地支撐百億到千億的大模型。
同時,to B 的產(chǎn)品的企業(yè)需求是相對穩(wěn)定的。這時候,關(guān)注的重點就不在于大模型本身,而是如何跟企業(yè)和行業(yè)結(jié)合的問題,成功與否是在最后一公里上。
因此,B 端產(chǎn)品對于算力的要求趨緩,是與 C端產(chǎn)品完全不同的、另一種創(chuàng)新過程——你可以花很大的精力去建設(shè)行業(yè)數(shù)據(jù),通過跟客戶合作,把最后一公里、最后的場景做得很好,從而建立起相應(yīng)的護城河。
3、對于行業(yè)落地而言,基座模型是硬實力
在剛過去的 WOT 全球科技創(chuàng)新大會上,周明提出了“三層大模型行業(yè)服務(wù)體系”。孟子大模型作為瀾舟的基座模型,即 L1 模型,同時更是行業(yè)模型 L2、未來的場景功能的引擎L3的基礎(chǔ),“我們對它尤其重視,也歡迎邀測用戶多提寶貴意見!”周明說道。
周明坦承,“孟子模型本身的能力還要進一步地提升。它的基本能力還可以,但還是有一些問題的。”
這些問題的原因有多方面。一方面,數(shù)據(jù)還需要進一步進行充實。其次,模型的 size 可能未來我們也會進一步地加強,比如說現(xiàn)在是百億模型,我們可以未來做到 300 億或 500 億的模型。但是我們比較慎重地去做千億模型,正是因為企業(yè)用戶對千億模型是用不起來的,推理也慢,代價成本太高。
對我們來講,訓(xùn)練一個開源模型大概要投入一個億左右,對任何一個大模型團隊都是要非常謹慎的一個事情。
關(guān)于這個基座模型接下來的動作,周明提出,未來會對“孟子”大模型的數(shù)據(jù)進行進一步地增強,訓(xùn)練方法也會進一步地提高。此外,一些具體的功能、算法也要進一步地鞏固完善,包括增強新的一些能力,都是接下來要考慮的事情。
4、下沉到場景中,為用戶而定制
大模型從通用走到行業(yè)、再走到場景,有很長的路要走。不是“煉一個大模型,給用戶隨便一調(diào)用”,然后就能解決掉某類問題,這太理想了。即使是ChatGPT也做不到。平時使用ChatGPT“閑聊”“看熱鬧”都沒問題,但讓 ChatGPT“交付”實活時,就會發(fā)現(xiàn)有很多問題,就要遵循從通用到行業(yè),再到場景的思路,逐步推進。
接下來,假如現(xiàn)在有了行業(yè)模型,要做場景模型,該如何做?
其一,要知道場景到底是什么。很多做大模型的團隊都不知道要做什么東西,比如金融,如果你不懂金融,根本就不知道金融業(yè)內(nèi)的大模型到底能做什么。于是,我們同華夏基金成立了聯(lián)合實驗室,去了解搞金融的人每天關(guān)心的事情,他們關(guān)心投研、投顧、風(fēng)控,關(guān)心信息抽取,關(guān)心搜索,關(guān)心輿情分析等等?!耙郧安皇嵌加腥俗鰡幔看嬖谑裁磫栴}?”你會發(fā)現(xiàn),之前大家以為很成熟的技術(shù),其實在某些領(lǐng)域應(yīng)用時,還存在不少問題沒有解決。
然而,這些“難啃的骨頭”,都是很難做的。周明說道,其實金融行業(yè)的科技人員,包括懂大模型、懂 AI 的人,很多很多,有很多的經(jīng)驗積累。當你知道了金融行業(yè)需要的這些能力,再回過頭思考,現(xiàn)有大模型能不能很好地支撐這個行業(yè)所需的能力,淺嘗輒止是做不成的,甚至效果還不如通用大模型,這時候你要跟人一起做起來。
其次,了解完這些之后,再去準備數(shù)據(jù)。要么是 raw data,增強你的行業(yè)大模型的能力;要么是 labeled data,做每一個場景任務(wù)的能力;要么你寫 prompt,你會發(fā)現(xiàn) prompt 寫完有時候也不行,說不定要做 finetune。所有這些功夫都是基于對用戶場景的理解所做出的一系列的重要動作,采取相應(yīng)的步驟,然后解決用戶的問題。周明表示,瀾舟跟金融機構(gòu)合作了很長時間,已經(jīng)沉淀了豐富的經(jīng)驗和教訓(xùn),對此有著非常清醒的認識。
在行業(yè)場景方面,大模型有許多價值有待挖掘。這里,周明給出了一個酒店場景幫助機器人實現(xiàn)“具象智能”的實例。酒店有其固有的場景,有自己內(nèi)部的地圖和環(huán)境,而酒店機器人在產(chǎn)生具體問題的時候,該采取怎樣的步驟,起初是人工寫好的,而對話模型就可以用來確認每一步是否做到了,如果檢測到錯誤,對話模型提醒機器人做錯了,相當于引導(dǎo)它把事情做得越來越好。機器人變聰明后,下一次再碰到這種事的時候就可以做得更好。
5、解決最后一公里,不能理想主義
從通用到場景模型,不同層級的團隊,能力要求也會不同。周明從兩個方面給出了瀾舟團隊的要求。在瀾舟的團隊中,L1(通用大模型)的人可以理解成“書呆子”,不懂行業(yè)是沒問題的,但需要知道怎么煉模型,包括從哪兒挖數(shù)據(jù),怎么清洗,怎么做強化學(xué)習(xí)等等,做 evaluation,怎么改模型,怎么調(diào)模型。
到了第二層L2(行業(yè)模型),則必須要懂行業(yè)。這些人大都搞人工智能出身,上哪兒懂行業(yè)?你自己不懂,配一個人懂也行,公司內(nèi)部的人沒人懂,到外部請一個顧問也行,否則就是瞎做。
做行業(yè)模型,不能理想主義。不是挖一點行業(yè)數(shù)據(jù),把大模型一套就是行業(yè)大模型。這樣做的水分特別大,有的時候還不如通用模型好。這就要求我們團隊要理解客戶,要跟客戶在一起,要做好最后一公里的事情。
所以,這對他們的理念、想法、工作方式都會產(chǎn)生新的變化。
6、未來大模型會形成多個生態(tài)
國內(nèi)基礎(chǔ)模型將來會形成一個什么樣的格局?周明認為,現(xiàn)在做任何判斷都為時過早。有人判斷全中國只需要一個基礎(chǔ)模型。他說道,“首先,無論是技術(shù)能力、威望、還是合規(guī)安全,目前這樣的公司或企業(yè)可能尚未出現(xiàn)。第二,由于市場競爭關(guān)系,巨頭公司之間很少會用其他公司的生態(tài)。”
周明認為,國內(nèi)基礎(chǔ)模型是會存在多個生態(tài)的,每個生態(tài)至少是有某一個模型。另一方面,單就 to B 領(lǐng)域,就給足了各個生態(tài)的發(fā)展空間。to B 就像一個汪洋大海,每一條涓涓細流中,魚兒都可以自由游動,甚至活得很滋潤。to B 存在很多創(chuàng)業(yè)新機會,包括對客戶/行業(yè)的理解,客戶跟大模型團隊形成某種意義上的戰(zhàn)略合作伙伴,形成壁壘等等,或者是形成所謂數(shù)據(jù)飛輪、功能飛輪。
大模型在 to B 領(lǐng)域,你做得越深,相應(yīng)的壁壘就越高。任何一個其他的公司,包括某些看似很強大的公司進來,它都要花同樣的功夫,其實是不容易的。包括微軟在內(nèi),它也不可能跟 OpenAI 攜手,把所有每一個細分的行業(yè)、每一個具體的任務(wù)、每一個場景都做得那么好。第一,它沒那么強的能力,它的人手有限。第二,它也沒必要,它做生態(tài),上下游都有生意,整個生態(tài)才能繁榮起來,這樣它才可以從中獲益。
所以,周明認為,鑒于過去互聯(lián)網(wǎng)包括移動互聯(lián)網(wǎng)的發(fā)展歷史,在這次大模型時代,大家應(yīng)該有一種平和的心態(tài),有一種建立生態(tài)的信念和想法。無論是大、中、小型企業(yè),無論是開發(fā)者還是用戶,最好能夠形成這種生態(tài),把智能 copilot 做好,使大家都能在大模型時代受益。
大模型屬于剛剛開始的階段,只是起點。AI 覆蓋了方方面面,這里可能蘊藏著十倍或者百倍于傳統(tǒng)互聯(lián)網(wǎng)的機會。解決了 AI 的問題,所有事情都會受益。所以,他非常期待社會各界對大模型有一種包容、共生的姿態(tài),共同促進大模型的發(fā)展。
7、寫在最后
正如周明所說,“通用大模型與千行百業(yè)的場景之間,是存在 gap 的?!贝竽P蜁r代,“針對用戶的場景做最后一公里”的效率會大幅提升,周明稱之為新一代軟件開發(fā)的范式。因為基于大模型的 prompt,可以提供很多功能引擎?,F(xiàn)在我們已經(jīng)可以用 Copilot 提高開發(fā)效率,更多要考慮的則是:把自己的用戶體驗想清楚、設(shè)計好,就很容易地構(gòu)造一種新的產(chǎn)品。
當然,好用的模型不是一蹴而就的。大模型廠家如何理解客戶、如何實現(xiàn)最后一公里的服務(wù)、如何真正把行業(yè)大模型做出來、如何低成本提供服務(wù)、商業(yè)模式如何合作、如何保護用戶隱私等等,都是躬身入局的大模型創(chuàng)客們需要親自回答的問題。
——嘉賓介紹——
瀾舟科技創(chuàng)始人兼 CEO 周明
周明,瀾舟科技創(chuàng)始人兼 CEO,現(xiàn)任中國計算機學(xué)會副理事長、創(chuàng)新工場首席科學(xué)家、中國人工智能學(xué)會會士和五所大學(xué)的博士生導(dǎo)師,世界 NLP 領(lǐng)域的領(lǐng)軍人物,世界上發(fā)表 ACL 論文最多的學(xué)者之一。曾任國際計算語言學(xué)學(xué)會主席、微軟亞洲研究院副院長。長期領(lǐng)導(dǎo)微軟亞洲研究院的 NLP 研究,在計算機創(chuàng)作、機器翻譯、搜索、推薦、預(yù)訓(xùn)練模型等領(lǐng)域獲得世界領(lǐng)先的研究成果并廣泛應(yīng)用于微軟的各類產(chǎn)品中。2021 年創(chuàng)立認知智能公司瀾舟科技,該公司致力于開發(fā)最先進的下一代認知智能技術(shù),包括自然語言和多模態(tài)信息的理解和生成、機器翻譯、知識圖譜、問答和推理、行業(yè)搜索、知識服務(wù)等技術(shù)。