中國信通院王蘊韜:從“好用”到“高效”,AIGC需要被再次顛覆
2022年11月30日,ChatGPT正式面向全球發(fā)布,AIGC浪潮由此席卷而來。
實際上,AIGC技術由來已久。
1957年,Lejaren Hiller和Leonard Isaacson通過將計算機程序中的控制變量改為音符,用計算機創(chuàng)作了音樂作品《Illiac Suite》。
2014年,美國《洛杉磯時報》記者Ken Schwencke通過編寫的算法程序,僅用3分鐘就完成了當時洛杉磯發(fā)生的一場4.4級地震的新聞報道。
那么,當下AIGC又有了怎樣的顛覆式技術?處于一個怎樣的發(fā)展階段?產(chǎn)業(yè)應用如何?以及存在哪些風險?
針對這些問題,我們與中國信通院云計算與大數(shù)據(jù)研究所副總工程師王蘊韜進行了一次深度對話,從他哪里找到了這些問題的答案。
大模型,再次喚醒AIGC
“和傳統(tǒng)基于深度學習技術的AIGC相比,以GPT為代表的生成式大模型在去年年底的出現(xiàn),直接將AIGC內(nèi)容質(zhì)量和好用程度提升到了一個新高度,AIGC這把火由此也再次被點燃?!边@是王蘊韜看到的行業(yè)變化。
大模型的出現(xiàn),對各個行業(yè)都帶來了不可忽視的影響,AIGC產(chǎn)業(yè)也不例外。
這其中AIGC的“C”,不僅僅是指OpenAI的ChatGPT帶火的“chatbot”中的文本內(nèi)容,還包括諸如圖片、視頻、代碼等內(nèi)容形式。
尤其過往十年人工智能技術的快速發(fā)展,讓人工智能技術在諸如圖像/視頻修復、低代碼等領域有了一定的應用,大模型的到來才能進一步對這些產(chǎn)業(yè)形成一次顛覆。
關于這次對于人工智能的技術顛覆,王蘊韜將其中的直觀感受總結為“可用”到“好用”。
對此,他進一步指出:
因為人工智能技術路線一直是在仿人類的神經(jīng)元功能演進的,在這之中,我們經(jīng)歷了“低仿”到“高仿”的發(fā)展階段。
此前基于深度學習的人工智能,是通過CNN、RNN網(wǎng)絡,先是做一個線性變換,再經(jīng)過一個激活函數(shù),從而實現(xiàn)“低仿”人類神經(jīng)元的算法模型。
現(xiàn)在再度火起來的AIGC背后的根技術是Transformer,有點類似編碼器和解碼器,通過將編碼和解碼放在一起,從而同時吸收更長的字符串(token)來做相關的任務處理。
從深度學習到現(xiàn)在的大模型,我們用的依然是廣義上的深度神經(jīng)網(wǎng)絡,只不過這個深度神經(jīng)網(wǎng)絡基本單元發(fā)生了變化。
大模型的出現(xiàn),改變了構成AIGC的基本單元,讓AIGC從“可用”跨越到了“好用”階段。
AIGC造“血”,行業(yè)內(nèi)容涌現(xiàn)
2023年是大模型的戰(zhàn)場,在這個戰(zhàn)場上,悄悄進行了兩場軍備競賽。
第一場是關于通用大模型,包括國外的微軟、谷歌、亞馬遜,以及國內(nèi)的BAT等科技巨頭,都加入到了這場競賽中。
他們通過引入規(guī)模龐大的公開數(shù)據(jù)集、通過預訓練,形成了通用大語言模型。
王蘊韜稱,這個通用大語言模型,實現(xiàn)了大模型從0到1的構建,但實際上是“0.5版大模型”。
之后在行業(yè)大模型的競賽中,真正適合深入到應用階段的大模型才開始出現(xiàn)。
關于后者,王蘊韜稱,大家主要是基于“0.5版大模型”在微調(diào),通過不斷灌輸行業(yè)知識,增加與人類專家的交互,從而將“0.5版大模型”調(diào)試得更加好用。
經(jīng)此“歷練”,AIGC最終有機會進一步深入到各個行業(yè),為各行各業(yè)造“血”。
“所有行業(yè)都需要生產(chǎn)內(nèi)容,實際上,如今的AIGC已經(jīng)在金融、電商、影視、傳媒等領域開始被規(guī)模應用?!?/p>
以影視和傳媒領域為例,這一領域各類機構和企業(yè)的核心競爭力就是提供內(nèi)容,這些機構如果能夠通過AIGC低成本高質(zhì)量生產(chǎn)內(nèi)容,必然會形成一次產(chǎn)業(yè)顛覆。因此,我們能夠看到,現(xiàn)在影視行業(yè)已經(jīng)在用AIGC進行后期制作,例如AI換臉就是已經(jīng)被大家熟知的熱門應用。
再如在電商領域,其中的直播帶貨、客服咨詢等環(huán)節(jié)所需要內(nèi)容服務都是AIGC最擅長的,而AIGC在電商內(nèi)容生成上已經(jīng)達到了非常理想的效果,尤其是人類很難實現(xiàn)的諸如直播帶貨中的24小時不間斷貨品推薦,已經(jīng)在通過AIGC來實現(xiàn)。
據(jù)王蘊韜的觀察,“實際上,在教育、工業(yè)、醫(yī)療、法律、農(nóng)業(yè)、設計、軟件,軟件編寫上,AIGC也確實已經(jīng)遍地開花?!?/p>
大模型評估標準難題
AIGC及其背后大模型的到來帶來的另一個難題是,如何建立起一套全新的評判標準。
在此之前,AI模型和算法經(jīng)過幾十年的發(fā)展,已經(jīng)形成了一套成熟的評判標準,不過王蘊韜告訴我們,這套標準并不適用于現(xiàn)在的AIGC和大模型。
此前學術界會先搭建一個評測數(shù)據(jù)集,通過將這個數(shù)據(jù)集放到不同模型中并對比輸出結果,以及與相對原有數(shù)據(jù)集的差異,從而判斷AI模型的能力,諸如斯坦福等高校都是這方面權威評測機構。
然而,“這樣的評測方法僅適用于原來判別式的AI模型,無法對現(xiàn)在生成式AI有一個很好的評測效果。”
從目前來看,國內(nèi)對于大模型和AIGC一些場景應用的評測及標準,尚且處于探討和研究階段,據(jù)王蘊韜透露,“信通院專門針對大模型和AIGC的評測評估標準做了不少探索性工作,但目前這些標準主要還是圍繞功能性指標,包括一個AIGC應用全生命周期實現(xiàn)哪些功能,這一塊我們已經(jīng)梳理出來了。”
但是針對AIGC背后大模型的性能有怎樣的突破,這仍是一個行業(yè)難題。
“大模型每次生成的東西都會有明顯的差異,如何判斷每次輸出都不一樣的開放性輸出和預想的輸出的契合度有多少,這是目前評測最難實現(xiàn)的點?!?/p>
王蘊韜表示,“目前我們只能通過主觀評價指標才能確定大模型究竟在性能上有多少提升,而針對相似度評估,整個產(chǎn)業(yè)界依舊非常欠缺?!?/p>
除此以外,王蘊韜還特別指出,如何讓大模型可管、可控,安全地工作,同樣是現(xiàn)在亟需解決的一個問題。
尤其是對于實時性、安全可控有高要求的行業(yè)和場景,現(xiàn)在尚且難以很好地應用AI大模型,“因為你完全無法預料大模型會輸出怎樣的結果。”
實際上,早在2021年,大模型剛剛興起時,產(chǎn)學研各界就已經(jīng)注意到了人工智能的安全可信,“我們當時做出過一個判斷:人工智能已經(jīng)進入到產(chǎn)業(yè)發(fā)展和治理重要度相同的新階段?!?/p>
“原來大家都只是盯著產(chǎn)業(yè)發(fā)展,只踩油門,不踩剎車,現(xiàn)在來看,因為它在賦能垂直行業(yè)過程中會產(chǎn)生很多倫理相關的問題,確實已經(jīng)進入到了一個新階段?!?/p>
正因如此,在大模型進入對地域性、安全性較高的行業(yè)時,也出現(xiàn)了私有大模型這樣獨特的應用,尤其在數(shù)據(jù)安全越來越被重視的當下,私有大模型也成了通用大模型、行業(yè)大模型之外,一個更具時代特色的大模型。
現(xiàn)在全球?qū)τ诘降资裁礃拥腁I是合乎科技倫理的、是可信的已經(jīng)基本達成一定的共識,但是現(xiàn)在需要將這些宏觀的、抽象的要求轉化為企業(yè)真正在開發(fā)產(chǎn)品時落實的一個準則。
AIGC需要被再次顛覆
大模型帶來的技術顛覆,為人工智能技術創(chuàng)新帶來了新的范式,但第一波賺到錢的,依然是“賣鏟子的人”。
王蘊韜表示,“通過堆算力的方式‘堆出來’的大模型效果已經(jīng)很不錯,但從商業(yè)角度來看,訓練成本和推理成本之高,消耗電量和算力之大是難以想象的。因而,現(xiàn)階段大模型解決的問題帶來的效益遠比它的成本投入要低。”
王蘊韜認為,針對大模型的商業(yè)化,接下來還需要供需方朝著兩個方向發(fā)力:
第一,從供給側來看,現(xiàn)在的大模型還有進一步壓縮成本、提高性價比的空間。
大家已經(jīng)意識到了以Transformer為代表的根技術還存在很大的問題,例如每增加一個token,它需要的算力是呈指數(shù)級增長的,對于由此帶來的成本,同樣如此。因此,從供給側來看,目前仍然有很大的提升空間。
第二,從使用側來看,現(xiàn)在AIGC做得最好的往往是企業(yè)自身數(shù)字化轉型程度很高的,提升自身數(shù)字化程度也就成了企業(yè)高效應用AIGC的一個必然前提。
如果想要在更廣泛的領域去應用AIGC技術,我們就需要這些領域在自己的數(shù)字化方面有更好的基礎建設,這個基礎的提升同樣需要大量的資金、人力和時間的投入,先擁有更高數(shù)字化建設基礎的企業(yè)和行業(yè),也將先受益于AIGC技術紅利。
而談到當下大模型的技術路徑,王蘊韜也特別指出,現(xiàn)在已經(jīng)有高校和機構意識到了商業(yè)化的問題,開始思考區(qū)別于Transformer的新的技術路線。
他指出,“從‘好用’到‘高效’,AIGC在未來也許會再經(jīng)歷一次或多次技術范式的顛覆?!?/p>