2022,人工智能開啟未來新密碼
購買大型電器、汽車,你是否會(huì)詢問有沒有智能語音功能?是的,潛移默化中人們已經(jīng)不再將人工智能當(dāng)作魔術(shù),而是習(xí)以為常的東西。從AlphaGo以四比一戰(zhàn)勝棋王李世石,讓人們第一次意識(shí)到人工智能真的可以超越人類,也讓人們對(duì)AI的未來前景充滿期待。
近年來,以深度學(xué)習(xí)為代表的人工智能技術(shù)高速蓬勃發(fā)展,新算法層出不窮,圖像識(shí)別、自然語言、聲音克隆等智能水平逼近甚至超過人類。同時(shí)人工智能技術(shù)的發(fā)展,也促進(jìn)著人類對(duì)數(shù)據(jù)以及算力的不斷突破。AI技術(shù)各類應(yīng)用落地,滲透到我們生活的方方面面,已然成為我們不可缺少的一部分。
1.2021回顧
回顧跌宕起伏的 2021年,新冠疫情仍然肆虐著世界,看不到疫情結(jié)束的信號(hào)。疫情帶來國際形勢(shì)的突然變化,深刻地影響著全球半導(dǎo)體產(chǎn)業(yè)鏈及生態(tài),同樣對(duì)人工智能行業(yè)帶來沖擊。國際間的算力競(jìng)爭(zhēng)異常激烈,如果算力不在一個(gè)維度上,競(jìng)爭(zhēng)力自然就不在一個(gè)維度上。2021年我國因?yàn)樾酒蛔銓?dǎo)致供應(yīng)鏈斷裂的事件此起彼伏,因此數(shù)字化、智能化轉(zhuǎn)型被列為國家重點(diǎn)發(fā)展規(guī)劃中,已成為大勢(shì)所趨。
疫情雖然還沒有結(jié)束,但絲毫不影響2021年人工智能領(lǐng)域洶涌澎湃的發(fā)展,振奮人心的消息頻頻傳來。
商湯科技,成為國內(nèi)「AI四小龍」中第一家IPO成功的上市公司;AphaFold2 成功預(yù)測(cè) 98% 蛋白質(zhì)結(jié)構(gòu);無人駕駛領(lǐng)域,技術(shù)和算法層面的不斷突破讓 L4場(chǎng)景落地日益成熟,掌握自動(dòng)倒車、搶道行駛等眾多接近人類駕駛的行為。
2021年10月,中國科學(xué)技術(shù)大學(xué)潘建偉、陸朝陽、劉乃樂等組成的研究團(tuán)隊(duì)與中國科學(xué)院上海微系統(tǒng)與信息技術(shù)研究所、國家并行計(jì)算機(jī)工程技術(shù)研究中心合作,構(gòu)建了113個(gè)光子144模式的量子計(jì)算原型機(jī)“九章二號(hào)”,完成對(duì)用于演示“量子計(jì)算優(yōu)越性”的高斯玻色取樣任務(wù)的快速求解,求解速度比目前全球最快的超級(jí)計(jì)算機(jī)快10的24次方倍(億億億倍)。我們正處在人類技術(shù)爆炸時(shí)期,人工智能賽道相信也必將獨(dú)占鰲頭。
多模態(tài)
多模態(tài)學(xué)習(xí)旨在使計(jì)算機(jī)擁有處理不同來源信息的能力,近年來成為了人工智能領(lǐng)域的研究熱點(diǎn)。將不同模態(tài)信息進(jìn)行融合,學(xué)習(xí)不同模態(tài)信息之間的關(guān)聯(lián)。2021年是OpenAI實(shí)現(xiàn)圖像和文本匹配的CLIP和根據(jù)輸入文本生成對(duì)應(yīng)圖像的Dall·E開啟了多模式學(xué)習(xí)的重要一年。同時(shí)DeepMind的Perceiver IO對(duì)文本、圖像、視頻和點(diǎn)云實(shí)現(xiàn)分類以及斯坦福大學(xué)的ConVIRT在醫(yī)療X光影像中添加了文本標(biāo)簽,都預(yù)示著多模態(tài)學(xué)習(xí)正在崛起并且滲入到其他領(lǐng)域。
Facebook也表示在其仇恨言論檢測(cè)器中也使用了多模態(tài)學(xué)習(xí),用以刪除了社交網(wǎng)絡(luò)中97%的辱罵以及有害內(nèi)容。該系統(tǒng)能根據(jù)文本、圖像和視頻在內(nèi)的10種數(shù)據(jù)類型,將模因和其他圖像文本配對(duì)歸類為良性或有害。同時(shí)谷歌也表示在搜索引擎中添加了多模態(tài)(及多語言)功能,實(shí)現(xiàn)了多任務(wù)統(tǒng)一模型能返回文本、音頻、圖像和視頻鏈接,以響應(yīng)75種語言中任意一種的查詢等。
巨大模型
讓機(jī)器去理解人類語言一直以來都是人工智能的核心夙愿,只有將人腦獨(dú)有的自然語言賦予機(jī)器,才能真正讓機(jī)器“活”過來。隨著OpenAI去年提出GPT-3模型,在各大平臺(tái)引起熱議,讓我們似乎觸摸到了上帝的領(lǐng)域。GPT-3模型比全球最大深度學(xué)習(xí)模型 Turing NLP 大上十倍,而且不僅可以更好地答題、翻譯、寫文章,還帶有一些數(shù)學(xué)計(jì)算的能力。根據(jù)論文所述,GPT-3是一種具有1750億個(gè)參數(shù)的自然語言深度學(xué)習(xí)模型。
就在大家還沉浸在GPT-3模型龐大參數(shù)量的時(shí)候,谷歌Switch Transformer開啟了2021年首個(gè)超過1萬億參數(shù)的模型,參數(shù)規(guī)模高達(dá)1.6萬億。隨后北京智源人工智能研究院推出更大的、擁有1.75萬億參數(shù)規(guī)模的大模型悟道2.0。資金雄厚的人工智能公司正以狂熱的速度堆積參數(shù),既為提高性能,也為秀肌肉,特別是在語言模型中,互聯(lián)網(wǎng)為無監(jiān)督和半監(jiān)督的預(yù)訓(xùn)練提供了大量無標(biāo)簽的數(shù)據(jù)。然而模型從“大”走向“巨大”的確可以使得效果越來越好,但同時(shí)帶來更多的問題與挑戰(zhàn)。
(1) 數(shù)據(jù)挑戰(zhàn):巨大的模型需要海量的數(shù)據(jù),但網(wǎng)絡(luò)和數(shù)字圖書館來源缺乏高質(zhì)量的數(shù)據(jù)。例如,研究人員常用的BookCorpus是一本由11000本電子書組成的數(shù)據(jù)集,用于訓(xùn)練30多種大型語言模型,它可能會(huì)傳播對(duì)某些宗教的偏見。人工智能社區(qū)越來越意識(shí)到數(shù)據(jù)質(zhì)量至關(guān)重要,但在收集大規(guī)模高質(zhì)量數(shù)據(jù)集的有效方法上尚未達(dá)成共識(shí)。對(duì)于巨大模型而言,海量高質(zhì)量數(shù)據(jù)采集成為了避不開的屏障。
(2) 速度與效率:當(dāng)前人類的硬件水平雖然在不斷突破,但是仍然跟不上巨大模型的需要。Switch Transformer背后的谷歌團(tuán)隊(duì)為了降低延遲開發(fā)了一種方法,讓每個(gè)token處理模型層的選定子集。他們的最佳模型比參數(shù)量只有1/30的模型快了約66%。同時(shí),微軟開發(fā)了DeepSpeed庫,這個(gè)庫并行處理數(shù)據(jù)、各層和層組,并通過在CPU和GPU之間劃分任務(wù)來減少冗余處理。然而最好的解決方案仍然是提升硬件的效率,人類必須要對(duì)算力進(jìn)行不斷突破。
(3) 巨大耗能:訓(xùn)練如此巨大的模型會(huì)消耗大量電能。2019年的一項(xiàng)研究發(fā)現(xiàn),在8個(gè)英偉達(dá)P100 GPU上訓(xùn)練2億參數(shù)的Transformer模型所造成的碳排放,幾乎和一輛普通汽車五年駕駛總排放量一樣多。如何降低訓(xùn)練巨大模型消耗電能的問題已經(jīng)擺在所有人面前。目前有望加速人工智能的新一代芯片,如Cerebras的WSE-2和谷歌的最新TPU,可能有助于減少排放。同時(shí),算力已然成為國家的基礎(chǔ)建設(shè)一部分,算力導(dǎo)致的能耗問題也敦促著需要更多的去使用風(fēng)能、太陽能等更清潔的能源。
計(jì)算機(jī)視覺
計(jì)算機(jī)視覺目前作為人工智能進(jìn)步最多、發(fā)展最快的領(lǐng)域,一直沖在賽道最前面。根據(jù)Grand View Research的數(shù)據(jù)顯示,2020年全球計(jì)算機(jī)視覺市場(chǎng)規(guī)模為113.2億美元,預(yù)計(jì)2021年至2028年將以7.3%的復(fù)合年增長率擴(kuò)大。目前競(jìng)爭(zhēng)比較激烈的計(jì)算機(jī)視覺子領(lǐng)域有:場(chǎng)景重建、目標(biāo)檢測(cè)、事件檢測(cè)、視頻跟蹤、目標(biāo)識(shí)別、3d姿態(tài)估計(jì)、運(yùn)動(dòng)估計(jì)、視覺伺服、3d場(chǎng)景建模、圖像修復(fù)。
作為上市公司的商湯科技提供的OpenMMLab是迄今為止最完備的計(jì)算機(jī)視覺算法體系和框架——“人工智能算法開放體系”,涉及超過10種研究方向,開放超過100種算法、600種預(yù)訓(xùn)練模型?,F(xiàn)如今OpenMMLab逐漸從單點(diǎn)單個(gè)方向的開源和單篇論文的開源走向日趨蓬勃的開源體系,成為底層訓(xùn)練框架、計(jì)算平臺(tái)與科研、教學(xué)和算法生產(chǎn)的重要橋梁和紐帶,極大加速AI科研和產(chǎn)業(yè)化的進(jìn)程。
強(qiáng)化學(xué)習(xí)
強(qiáng)化學(xué)習(xí)可以說是最貼近人類學(xué)習(xí)過程的AI了,換位思考一下,我們從小到大不斷地學(xué)習(xí),就是一個(gè)不斷試錯(cuò)的過程。強(qiáng)化學(xué)習(xí)就像一個(gè)真實(shí)的孩子,自我生長,不需要大量的歷史數(shù)據(jù)做引導(dǎo),只有不需要監(jiān)督的學(xué)習(xí)才是人工智能最好的形態(tài)。
強(qiáng)化學(xué)習(xí)理論收到人類行為主義心理學(xué)啟發(fā),側(cè)重在線學(xué)習(xí)并試圖在探索-利用(exploration-exploitation)間保持平衡。不同于監(jiān)督學(xué)習(xí)和非監(jiān)督學(xué)習(xí),強(qiáng)化學(xué)習(xí)不要求預(yù)先給定任何數(shù)據(jù),而是通過接收環(huán)境對(duì)動(dòng)作的獎(jiǎng)勵(lì)(反饋)獲得學(xué)習(xí)信息并更新模型參數(shù)。過去幾年中,無論是Facebook、Google、Deepmind、Amazon還是Microsoft,他們都投入了大量時(shí)間、金錢、人力來推動(dòng)強(qiáng)化學(xué)習(xí)的不斷創(chuàng)新。
2.國內(nèi)的各大AI云平臺(tái)涌現(xiàn)
隨著人工智能的日益火爆,國內(nèi)大廠們紛紛在AI領(lǐng)域布局。AI開放平臺(tái)已經(jīng)和當(dāng)初的云計(jì)算平臺(tái)一樣,如雨后春筍般涌現(xiàn)。AI開放平臺(tái)已經(jīng)成為了企業(yè)重要的基礎(chǔ)建設(shè)。列舉目前國內(nèi)比較有代表性的AI開放平臺(tái):
- 百度飛漿
- 阿里云人工智能平臺(tái)
- 騰訊AI開放平臺(tái)
- 科大訊飛開放平臺(tái)
- 華為云ModelArts
- 曠視Face++
- 360人工智能研究院
- 網(wǎng)易人工智能
AI云平臺(tái)的本質(zhì)仍然延續(xù)了大數(shù)據(jù)時(shí)代經(jīng)典的租賃模式,似乎讓我們回到了幾年前大數(shù)據(jù)風(fēng)起云涌的年代。而AI云平臺(tái)的優(yōu)勢(shì)在于讓越來越多開發(fā)者對(duì)AI有更簡(jiǎn)單直觀的認(rèn)識(shí),他提供了許多頂會(huì)模型供大家學(xué)習(xí)的同時(shí),也提供了開發(fā)者將自己作品上傳展示的平臺(tái)。
讓AI不再離我們遙遠(yuǎn),成為人人都可以使用的東西。只有成熟的社區(qū)文化,才能孕育出新的創(chuàng)作者,也讓市場(chǎng)上出現(xiàn)越來越多的人工智能產(chǎn)品,AI云平臺(tái)核心意義就在這里。
3.2022趨勢(shì)
創(chuàng)立17年的Facebook在美國時(shí)間2021年10月28日正式宣布改名為“Meta”,如一個(gè)重磅炸彈,在業(yè)內(nèi)引起了驚濤駭浪。扎克伯格用實(shí)際行動(dòng)向大家宣布,元宇宙已經(jīng)來了。隨之而來的2022年,將迎來人工智能新一輪趨勢(shì)風(fēng)暴。
元宇宙真正意義上的拐點(diǎn)
如果說2021年人們認(rèn)為元宇宙還只是妄想家的一廂情愿,那么2022年將真正開始顛覆人類對(duì)“世界”兩個(gè)字的理解。所以筆者認(rèn)為2022年可以成為元宇宙真正意義上的拐點(diǎn)。在技術(shù)角度看,元宇宙主要技術(shù)群有:網(wǎng)絡(luò)以及算力技術(shù)、人工智能、游戲技術(shù)、顯示技術(shù)(VR、AR、MR甚至是XR,體驗(yàn)不斷深化)、區(qū)塊鏈技術(shù)。而筆者認(rèn)為,人工智能將會(huì)是整個(gè)元宇宙的核心,甚至是元宇宙的母體或者說是大腦。為了演化真正的社會(huì)形態(tài),需要母體不斷自我學(xué)習(xí),而不是設(shè)定各種各樣的規(guī)則不斷修補(bǔ)社會(huì)形態(tài)。就像《失控玩家》電影一樣,由母體創(chuàng)造的NPC也會(huì)隨著社會(huì)形態(tài)的演變而進(jìn)化。
根據(jù)Bloomberg Intelligence預(yù)測(cè),元宇宙的投資與價(jià)值只會(huì)在未來幾年不斷增長,到2024年價(jià)值將高達(dá)8000億美元。在如此大的宏利明前,只會(huì)讓市場(chǎng)不斷敦促人工智能產(chǎn)能不斷突破。
算力革命
隨著全球自動(dòng)駕駛需求不斷擴(kuò)大,圍繞大算力芯片的競(jìng)爭(zhēng)2022年將異常熱鬧。因?yàn)榻衲?,英偉達(dá)自動(dòng)駕駛芯片Orin將量產(chǎn),高通Snapdragon Ride也將量產(chǎn),而中國創(chuàng)業(yè)企業(yè)的大算力芯片也將量產(chǎn)。楊宇欣給出了一組數(shù)據(jù):2014—2016年特斯拉ModelS的算力為0.256TOPS,2017年蔚來ES8的算力是2.5TOPS,2019年特斯拉Model3算力為144TOPS,2021年智己L71070TOPS,2022年蔚來ET7是1016 TOPS。這組數(shù)據(jù)進(jìn)一步印證了這樣一個(gè)事實(shí):智能駕駛每前進(jìn)一小步,后面都需要算力前進(jìn)一大步。算力的作用不單單體現(xiàn)在汽車行業(yè),2021年11月8月,阿里巴巴達(dá)摩院公布了多模態(tài)大模型“M6”的最新進(jìn)展,其參數(shù)已從萬億躍遷至10萬億,成為全球最大的AI預(yù)訓(xùn)練模型。在10月,M6再次突破業(yè)界極限,使用512顆GPU,在10天內(nèi)就訓(xùn)練出了具有可用水平的10萬億模型,相比2020年發(fā)布的大模型GPT-3,M6實(shí)現(xiàn)了同等參數(shù)規(guī)模,能耗卻只有1%。
越來越強(qiáng)大的算力是更智能人工智能模型可用的基礎(chǔ),隨著人工智能行業(yè)不斷發(fā)展,不只是技術(shù)的革命,更加是算力的革命。兵馬未動(dòng)糧草先行,算力作為人工智能模型的主要消耗品,決定著人工智能邁進(jìn)的速度。就在2021 年 11 月,摩爾線程宣布已完成 20 億元人民幣 A 輪融資。該輪融資由上海國盛資本、五源資本、中銀國際旗下渤海中盛基金聯(lián)合領(lǐng)投,建銀國際、前海母基金、等九家機(jī)構(gòu)聯(lián)合參投。在宣布該輪融資的同時(shí),摩爾線程同時(shí)宣布其首顆全功能 GPU 芯片如期研制成功,且已經(jīng)開始適配國產(chǎn)主流 CPU 和操作系統(tǒng)。所籌資金將重點(diǎn)用于首顆 GPU 芯片的批量生產(chǎn)與制造、GPU SOC 相關(guān)聯(lián)的 IP 研發(fā)、以及國產(chǎn) GPU 生態(tài)系統(tǒng)的拓展等。隨著算力革命的打響,各國都將投入大量的資本和人力,這場(chǎng)沒有硝煙的戰(zhàn)爭(zhēng)會(huì)將人工智能推上全新的高度。
AI門檻降低帶來工業(yè)生產(chǎn)全面應(yīng)用
隨著AI的不斷發(fā)展,人類算力的不斷提升,AI的使用門檻也越來越低。如智能語音系統(tǒng)、智能客服等商業(yè)落地,比比皆是。另一方面如短中長視頻業(yè)務(wù),在全球仍保持著較高的增長速度,視頻內(nèi)容創(chuàng)作者和內(nèi)容消費(fèi)者活躍度非常高。其中作為全球最火的手機(jī)應(yīng)用“抖音”,大量的視頻智能處理技術(shù)可以幫助創(chuàng)作者更好地創(chuàng)作作品。另外,北京冬奧會(huì)中AI虛擬氣象主播、AI手語主播、場(chǎng)館智能向?qū)?、智能語言翻譯、鷹眼裁判、AI運(yùn)動(dòng)員訓(xùn)練系統(tǒng)等等都是人工智能全面應(yīng)用的體現(xiàn)。
預(yù)訓(xùn)練大模型降低了 AI 應(yīng)用的門檻,解決了 AI 應(yīng)用的兩個(gè)難題:數(shù)據(jù)和行業(yè)知識(shí)。它既不需要大量的標(biāo)注數(shù)據(jù),又保障了基礎(chǔ)底座。所以擺在企業(yè)家面前的最大問題不再是技術(shù)如何突破,而是商業(yè)模式如何建立,商業(yè)閉環(huán)如何落地,以及技術(shù)轉(zhuǎn)化為產(chǎn)品的效率。
科學(xué)界AI技術(shù)將作為新生產(chǎn)工具
根據(jù)阿里巴巴達(dá)摩院對(duì)2022年十大科技預(yù)測(cè),其中趨勢(shì)一就是:AI for Science。
引用:實(shí)驗(yàn)科學(xué)和理論科學(xué)是數(shù)百年來科學(xué)界的兩大基礎(chǔ)范式,而人工智能正在催生新的科研范式。機(jī)器學(xué)習(xí)能夠處理多維、多模態(tài)的海量數(shù)據(jù),解決復(fù)雜場(chǎng)景下的科學(xué)難題,帶領(lǐng)科學(xué)探索抵達(dá)過去無法觸及的新領(lǐng)域。人工智能不僅將加速科研流程,還將幫助發(fā)現(xiàn)新的科學(xué)規(guī)律。預(yù)計(jì)未來三年,人工智能將在應(yīng)用科學(xué)中得到普遍應(yīng)用,在部分基礎(chǔ)科學(xué)中開始成為科學(xué)家的生產(chǎn)工具。
沒錯(cuò),除了DeepMind在2021年初開源了AlphaFold2,并且能夠預(yù)測(cè)出98.5%的蛋白質(zhì)結(jié)構(gòu)。2021年12月,DeepMind首次利用人工智能幫助數(shù)學(xué)家們提出了兩個(gè)全新的數(shù)學(xué)猜想,登上Nature封面。作者猜測(cè)低維拓?fù)渲写嬖谖粗姆蔷€性關(guān)系,產(chǎn)生了很多數(shù)據(jù)并用神經(jīng)網(wǎng)絡(luò)擬合了近似函數(shù),發(fā)現(xiàn)其中三個(gè)量在擬合過程中起到了很重要的作用。通過反正做擬合實(shí)驗(yàn),產(chǎn)生新的數(shù)據(jù),得到新的觀察模型,最終數(shù)學(xué)家利用智慧猜出了一個(gè)不等式結(jié)構(gòu),并進(jìn)一步給了嚴(yán)格的證明。
由此可見人工智能成為了科學(xué)家新生產(chǎn)工具之后,不但可以加速科學(xué)發(fā)展的進(jìn)度,更加可以讓人工智能創(chuàng)造新的設(shè)想,甚至讓某些科學(xué)產(chǎn)生新的方向。
4.小結(jié)
2022年必然會(huì)成為人工智能技術(shù)爆發(fā)的一年,我們有可能會(huì)見證以前從未有過的成果。人工智能深入我們的生活,給我們帶來更多便捷的同時(shí),也帶來更多的挑戰(zhàn)和機(jī)遇。