AI大模型未來將走向何方?廣泛應(yīng)用成首要挑戰(zhàn)
目前在AI行業(yè),大模型火到破圈。
今年11月初,華為云盤古大模型的機場廣告在首都機場和深圳寶安機場亮相,主打“行業(yè)AI開發(fā)應(yīng)用優(yōu)選”的定位。11月18日,權(quán)威時政媒體中國新聞周刊官方微博發(fā)布了華為云盤古大模型海報,引發(fā)了廣泛關(guān)注。

以往,AI大模型這類基礎(chǔ)設(shè)施層面的前沿技術(shù)極少在大眾廣告渠道被看到。如今,大模型不僅成為眾多AI行業(yè)峰會中被高頻討論的熱詞,在AI行業(yè)之外的影響力也日漸擴大。這些都表明,AI大模型正在加速走出實驗室,成為賦能各行各業(yè)的通用AI基礎(chǔ)設(shè)施。
自2020年OpenAI推出NLP大模型GPT3至今,全球范圍內(nèi)AI大模型迎來大爆發(fā),參與企業(yè)越來越多,參數(shù)級別越來越大,成為新一輪AI競賽的賽場。目前,大模型吸引了谷歌、微軟、英偉達、華為、智源研究院、百度、阿里、商湯、浪潮、中科院自動化所等科技巨頭和頂尖科研機構(gòu)參與其中,各家大模型的參數(shù)量級也從千億、萬億,迅速躍遷到了10萬億級別。
同時我們也看到,大模型火爆的背后卻面臨廣泛應(yīng)用的困局。技術(shù)很牛,落地很難,不夠接地氣,成為業(yè)界對大模型發(fā)展的普遍認知。大模型百家爭鳴的格局背后,AI行業(yè)更需要冷思考。
AI大模型應(yīng)該為應(yīng)用而生
為什么眾多科技巨頭扎堆推出大模型?
這要回歸到AI落地的核心挑戰(zhàn)。國際歐亞科學院院士、華為云人工智能領(lǐng)域首席科學家、IEEE Fellow田奇認為,AI進入千行百業(yè)面臨很多挑戰(zhàn),其中最重要有三點:第一,AI場景碎片化使得AI技術(shù)難以大規(guī)模復(fù)制。傳統(tǒng)的定制化、作坊式的模型開發(fā)方式是“一個場景一個模型”,無法復(fù)用和積累,導(dǎo)致AI開發(fā)的高門檻、高成本。第二,如何將行業(yè)知識與AI技術(shù)相結(jié)合,跨越行業(yè)know how與AI技術(shù)之間的鴻溝。第三,AI技術(shù)一直面臨攻擊、隱私、安全以及可解釋性方面的難題。
AI大模型擁有超大規(guī)模參數(shù)、巨量訓練數(shù)據(jù),通過模型的巨量化可以提高人工智能的通用屬性,并降低人工智能的應(yīng)用門檻。正因為直擊AI落地的挑戰(zhàn),大模型成為很多AI企業(yè)的共識。
那么,AI大模型能帶來科學計算的范式革命嗎?目前還存在哪些局限?10月底,華為云AI院長峰會匯聚了AI產(chǎn)學研各界的最強大腦,來自華為的AI科學家與來自中國科學院、中國工程院以及國內(nèi)30余所頂尖高校的數(shù)十名院長、教授關(guān)于AI大模型的現(xiàn)狀和前景進行了專業(yè)的探討。各界大咖普遍認為,目前AI大模型最大挑戰(zhàn)在應(yīng)用落地,如何讓更多行業(yè)和場景真正用起來。
首先,不是所有場景都需要大模型。大模型在醫(yī)藥研發(fā)、衛(wèi)星遙感、災(zāi)害評估、自然生態(tài)監(jiān)測等場景有巨大價值,但一些數(shù)據(jù)量小、任務(wù)并不復(fù)雜的場景,并不適合使用大模型,相當于“大炮打蚊子”。
其次,大模型不是參數(shù)數(shù)量越大越好,如何廣泛應(yīng)用才是最大價值和難點。大模型應(yīng)用價值取決于其泛化能力,能否快速適配不同場景。
一位AI領(lǐng)域教授認為:“大模型不在于大,而在于能不能解決應(yīng)用的問題,是不是來自于真正的需求。怎么樣能夠在更廣泛的應(yīng)用場景中用起來,這是目前大模型非常大的挑戰(zhàn)。”
“大模型應(yīng)該是AI走向下一個時代的跳板。大模型的大一定是體現(xiàn)它能夠去掌握、組織更大量的數(shù)據(jù),而不是模型的參數(shù)量大。”一位華為云高級研究員也持同樣的觀點。
第三,大模型不是萬能的,不應(yīng)該希望一個大模型能解決所有問題。
“如果大模型想要實際用的比較好,一定要有配套的工作流。如果把下游的工作流程給搭建起來,大模型在很多場景上能夠得到比較好的應(yīng)用。”該高級研究員表示。
深入AI落地的無人區(qū)
如果說參數(shù)的直觀對比類似外行看熱鬧,那么,落地能力才是大模型實力的真正較量。
目前,大模型在落地層面還處在探索的初期,各大科技巨頭都在摸索嘗試。其中華為云盤古大模型在行業(yè)應(yīng)用方面走得更遠,已經(jīng)在能源、零售、金融、工業(yè)、醫(yī)療、環(huán)境、物流等行業(yè)的100多個場景實際應(yīng)用, 讓企業(yè)的AI應(yīng)用開發(fā)效率平均提升了90%。
今年4月華為云發(fā)布的盤古系列預(yù)訓練大模型具有超大規(guī)模參數(shù)、超高精度的特質(zhì),還提供模型預(yù)訓練、微調(diào)、部署和迭代的功能,以減少行業(yè)側(cè)的數(shù)據(jù)標注依賴,從而降低人工智能開發(fā)的門檻和成本。
華為云盤古系列大模型包括NLP(中文語言)大模型、CV(視覺)大模型、多模態(tài)大模型和科學計算大模型。盤古大模型家族還在不斷壯大,今年9月華為云新推出盤古藥物分子大模型,其研究了17億個小分子的化學結(jié)構(gòu),可以高效生成藥物新分子,計算蛋白質(zhì)靶點匹配,預(yù)測新分子生化屬性,并對篩選后的先導(dǎo)藥進行定向優(yōu)化,實現(xiàn)全流程的AI輔助藥物設(shè)計。
在眾多行業(yè)場景中,還存在著大量AI尚未落地的無人區(qū)。其中很多場景都有這樣的特征:樣本復(fù)雜多樣且不均衡,如果使用傳統(tǒng)AI模型標注成本高、效率低、準確率也有待提升。這些場景正是盤古AI大模型的典型應(yīng)用場景之一。盤古大模型把自己化作AI世界的開路先鋒,深入傳統(tǒng)AI模型難以觸及的領(lǐng)域,不斷探索AI落地的前沿。
在電力行業(yè),國網(wǎng)重慶永川公司在智能電力巡檢場景用無人機代替人工進行缺陷檢測,但面臨海量數(shù)據(jù)標注工作量大和缺陷種類繁多等問題。盤古 CV 大模型利用海量無標注電力數(shù)據(jù)進行預(yù)訓練,并結(jié)合少量標注樣本微調(diào)的高效開發(fā)模式,提出了針對電力行業(yè)的預(yù)訓練模型。應(yīng)用之后,樣本篩選效率提升約 30 倍,篩選質(zhì)量提升約 5 倍,以永川每天采集 5 萬張高清圖片為例,可節(jié)省人工標注時間 170 人天。
同時,結(jié)合華為云盤古大模型搭載的自動數(shù)據(jù)增廣以及類別自適應(yīng)損失函數(shù)優(yōu)化策略,可以做到一個模型適配上百種缺陷,一個模型就可以替代永川原先的 20 多個小模型,極大地減少了模型維護成本,平均精度提升 18.4%,模型開發(fā)成本降低 90%。
在金融行業(yè),金融機構(gòu)擔保貸款通常要求企業(yè)提供不動產(chǎn)擔保。原因在于動產(chǎn)移動性較強,很難控制動產(chǎn)的去向和價值,監(jiān)管難度大,銀行提供貸款風險較高。因此動產(chǎn)很難作為抵押物進行融資貸款,造成中小企業(yè)融資難的困境。
浦發(fā)銀行的浦惠云倉項目利用人工智能、物聯(lián)網(wǎng)、區(qū)塊鏈、金融科技等相關(guān)技術(shù),能夠智能地監(jiān)測收貨、入庫、在庫、出庫等環(huán)節(jié),識別異常行為,確保貨物“不調(diào)包”和貨物數(shù)量準確。該項目采用華為云盤古大模型,用一個模型覆蓋全部9種物流場景,通過對人員異常行為、入庫/出庫異常檢測、叉車軌跡異常識別等全部流程檢測,實現(xiàn)了對動產(chǎn)的實時監(jiān)管,增強了銀行風控能力。另外數(shù)字化也提高了動產(chǎn)解質(zhì)押、出庫、進入市場等環(huán)節(jié)的流通時間,將原來的為120天資金占用回款周期縮短到20-30天,大幅降低了企業(yè)的融資成本。
在生態(tài)監(jiān)測方面,華為云盤古科學計算大模型實現(xiàn)了對全球海浪浪高的實時預(yù)測,在精度和覆蓋范圍與傳統(tǒng)科學計算相當?shù)幕A(chǔ)上,將預(yù)測速度提升到了原來的10,000倍。
在時尚產(chǎn)業(yè),華為云盤古多模態(tài)大模型強大的跨模態(tài)檢索、跨模態(tài)生成能力,不斷延伸AI的創(chuàng)造力。通過以文搜圖和以圖搜文能力,可以實現(xiàn)趨勢預(yù)測。通過以文生圖和以圖生圖能力,盤古多模態(tài)大模型可以通過文本控制來快速生成服裝圖片,供人類設(shè)計師參考。
優(yōu)秀的泛化能力是如何煉成的?
當大模型普遍受困于落地難題,為什么盤古大模型率先做到了廣泛應(yīng)用?這離不開其開發(fā)過程中首次采用的眾多領(lǐng)先技術(shù)。
比如,盤古大模型首次在對比度自監(jiān)督學習中引入了樣本相似性,使得小樣本學習的能力獲得了顯著提升。盤古 CV 大模型是首個判別與生成聯(lián)合預(yù)訓練的模型,其小樣本學習性能在 10% 的標簽分類上精度達到了業(yè)界第一。盤古大模型首創(chuàng)采用“階段式訓練”和“動態(tài)冰化”策略,顯著提升大模型訓練的穩(wěn)定性和效率;在下游應(yīng)用中,僅需少量樣本和學習參數(shù)即可完成千億規(guī)模大模型的快速微調(diào)和下游適配等等。
作為盤古大模型的“設(shè)計師”,田奇此前曾表示,盤古大模型設(shè)計之初秉持了三個核心原則:“第一,網(wǎng)絡(luò)規(guī)模要大;第二,模型大但不能臃腫,有強壯的網(wǎng)絡(luò)架構(gòu),希望它是百米冠軍,系統(tǒng)的性能要做到極致,綜合性能提升10%以上;第三,希望它有優(yōu)秀的泛化能力,也就是場景覆蓋率要高,不僅是單項的百米冠軍,也希望是10項全能冠軍。”
之所以堅持這樣的技術(shù)路線,源自盤古大模型的初衷:讓AI開發(fā)由作坊式向工業(yè)式轉(zhuǎn)變,降低行業(yè)AI開發(fā)應(yīng)用門檻,讓大模型真正走進千行百業(yè),不再只是大資本和大實驗室的專屬。在AI走向千行百業(yè)過程中,華為云盤古大模型在行業(yè)落地方面快人一步,能夠幫助行業(yè)專家快速掌握AI技能。
“華為云AI的目標就是持續(xù)創(chuàng)新,打造人工智能黑土地,使能大規(guī)模、可復(fù)制的AI行業(yè)應(yīng)用。”田奇表示。
放眼全球AI產(chǎn)業(yè),大模型已經(jīng)成為國際間AI技術(shù)競爭的一個熱點,通過大模型構(gòu)筑中國AI技術(shù)競爭壁壘,是這一代中國科技企業(yè)的機遇和挑戰(zhàn)。中國工程院院士、鵬城實驗室主任、北京大學信息科學技術(shù)學院院長、教授高文院士曾經(jīng)指出,中國的人工智能產(chǎn)業(yè)有政策支持、數(shù)據(jù)資源、應(yīng)用場景、青年人才四個長板。其中,豐富的數(shù)據(jù)資源和應(yīng)用場景是我國AI產(chǎn)業(yè)非常突出的優(yōu)勢。
如何將散落在各行各業(yè)的數(shù)據(jù)生產(chǎn)要素價值發(fā)揮到極致,AI大模型大有可為。尤其是當AI大模型與行業(yè)專家的知識相結(jié)合,必將開啟新一輪的AI應(yīng)用浪潮,爆發(fā)出巨大的價值。