15張圖表帶你速覽2021人工智能最新趨勢(shì)
「2021年人工智能指數(shù)報(bào)告」由斯坦福大學(xué)Human-Centered人工智能研究所,以及來(lái)自哈佛大學(xué),經(jīng)濟(jì)合作與發(fā)展組織,the Partnership on AI合作組織和SRI International的11名專家組成的指導(dǎo)委員會(huì)共同編制。這份報(bào)告引用了大量AI研究數(shù)據(jù),引用了包括:arXiv的AI研究數(shù)據(jù),Crunchbase的資金數(shù)據(jù),以及對(duì)Black in AI和Queer in AI等團(tuán)體的調(diào)查。
報(bào)告對(duì)2021年度人工智能最新的研究趨勢(shì)和進(jìn)展進(jìn)行了總結(jié),并分析了資本、政策對(duì)AI技術(shù)的影響,以及深度學(xué)習(xí)、圖像識(shí)別、語(yǔ)言識(shí)別等AI主要子領(lǐng)域的研究。
一 人工智能的盛夏
人工智能研究工作正處在爆炸增長(zhǎng)期:2019年全球發(fā)布了超過(guò)12萬(wàn)篇人工智能研究領(lǐng)域的同行評(píng)審論文。自2000年以來(lái),人工智能領(lǐng)域論文在同行評(píng)審論文中的占比,從0.8%一路攀升至2019年的3.8%。
二 中國(guó)在人工智能研究領(lǐng)域取得顯著成就
自2017年中國(guó)研究人員發(fā)表的同行評(píng)審論文首次超過(guò)歐洲以來(lái),中國(guó)的人工智能研究論文數(shù)量持續(xù)上升。到2020年,中國(guó)研究人員發(fā)布的人工智能研究論文在權(quán)威期刊的引用率已經(jīng)領(lǐng)先全球。
AI指數(shù)指導(dǎo)委員會(huì)聯(lián)合主任Jack Clark表示,這些數(shù)據(jù)對(duì)中國(guó)來(lái)說(shuō)似乎是「學(xué)術(shù)成功的指標(biāo)」,也在一定程度上映射出不同國(guó)家在人工智能生態(tài)體系建設(shè)方面的現(xiàn)狀。他認(rèn)為研究論文更像是一種學(xué)術(shù)權(quán)威認(rèn)證,一個(gè)領(lǐng)域的學(xué)術(shù)性越弱,其行業(yè)實(shí)用性可能會(huì)越強(qiáng)。他指出:「中國(guó)有獲得期刊出版物的明確政策,政府機(jī)構(gòu)在研究中發(fā)揮更大的作用,而在美國(guó),大部分這方面的研發(fā)主要集中在企業(yè)內(nèi)部?!?/span>
三 快速訓(xùn)練=更好的AI
MLPerf以訓(xùn)練速度與硬件的關(guān)系為基礎(chǔ),分析了機(jī)器學(xué)習(xí)的系統(tǒng)性能,客觀地對(duì)機(jī)器學(xué)習(xí)系統(tǒng)性能進(jìn)行排名。通過(guò)對(duì)各種圖像分類器系統(tǒng)在標(biāo)準(zhǔn)ImageNet數(shù)據(jù)庫(kù)上進(jìn)行培訓(xùn),并根據(jù)訓(xùn)練時(shí)間進(jìn)行排名。2018年,訓(xùn)練最佳系統(tǒng)需要6.2分鐘;2020年,培訓(xùn)最佳系統(tǒng)需要47秒。這一進(jìn)步也得益于近年來(lái)機(jī)器學(xué)習(xí)專用芯片的快速發(fā)展。
報(bào)告認(rèn)為,硬件加速對(duì)機(jī)器學(xué)習(xí)的影響至關(guān)重要。系統(tǒng)訓(xùn)練耗時(shí)幾秒和幾小時(shí)的差別巨大,這種差異直接影響著研究人員的想法,以及研究的類型和數(shù)量,以及它可能影響到的研究風(fēng)險(xiǎn)。
四 AI不能理解「喝咖啡」?
在過(guò)去的幾年里,人工智能在靜態(tài)圖像識(shí)別方面的進(jìn)展突飛猛進(jìn),而計(jì)算機(jī)視覺(jué)未來(lái)必將朝著視頻識(shí)別的方向發(fā)展。研究人員正在構(gòu)建可以從視頻剪輯中識(shí)別各種活動(dòng)的系統(tǒng),因?yàn)槿绻麑C(jī)器視覺(jué)應(yīng)用到現(xiàn)實(shí)世界(例如自動(dòng)駕駛汽車、監(jiān)控?cái)z像頭等),這種類型的識(shí)別可能會(huì)大有用處。計(jì)算機(jī)視覺(jué)性能的基準(zhǔn)之一是ActivityNet數(shù)據(jù)集,其中包含來(lái)自2萬(wàn)個(gè)視頻的近650小時(shí)鏡頭。在其中顯示的200項(xiàng)日常生活活動(dòng)中,人工智能系統(tǒng)在2019年和2020年都很難識(shí)別「喝咖啡」這項(xiàng)活動(dòng)。這似乎是一個(gè)主要問(wèn)題,因?yàn)楹瓤Х仁撬衅渌顒?dòng)的基本活動(dòng)。無(wú)論如何,這是未來(lái)幾年值得關(guān)注的領(lǐng)域。
五 自然語(yǔ)言識(shí)別需要更難的測(cè)試
自然語(yǔ)言處理(NLP)的迅速崛起似乎遵循了計(jì)算機(jī)視覺(jué)的軌跡,在過(guò)去十年中,計(jì)算機(jī)視覺(jué)從學(xué)術(shù)領(lǐng)域的分支專業(yè)發(fā)展成為廣泛的商業(yè)部署。今天的NLP也由深度學(xué)習(xí)驅(qū)動(dòng),Jack Clark認(rèn)為,NLP繼承了計(jì)算機(jī)視覺(jué)工作的策略,例如對(duì)大型數(shù)據(jù)庫(kù)的訓(xùn)練和特定應(yīng)用程序的微調(diào)。他說(shuō):「我們看到這些創(chuàng)新非常迅速地流向人工智能的另一個(gè)領(lǐng)域?!?/span>
Jack Clark表示,衡量NLP系統(tǒng)的性能正在變得很棘手,學(xué)術(shù)界一直在研發(fā)更為困難的AI測(cè)試系統(tǒng)和指標(biāo),但無(wú)論何種系統(tǒng)總會(huì)在六個(gè)月內(nèi)出現(xiàn)新的AI擊敗它。這份圖表顯示了兩個(gè)版本的閱讀理解測(cè)試SQuAD的表現(xiàn),人工智能語(yǔ)言模型必須根據(jù)一段文本回答多項(xiàng)選擇題。2.0版通過(guò)包含無(wú)法回答的問(wèn)題來(lái)使任務(wù)更加困難,模型必須識(shí)別這些問(wèn)題,并且不回答。一個(gè)模型在第一個(gè)版本上花了25個(gè)月才超過(guò)人類的性能,但另一個(gè)模型只花了10個(gè)月就完成了更艱巨的任務(wù)。
六 NLP也存在「種族歧視」
語(yǔ)音識(shí)別和文本生成等任務(wù)的語(yǔ)言模型總的來(lái)說(shuō)已經(jīng)非常完善了。但即便在主流的成熟商業(yè)NLP系統(tǒng)中仍存在認(rèn)知偏差,如果這些問(wèn)題不得到解決,則可能會(huì)嚴(yán)重影響這些技術(shù)的商業(yè)應(yīng)用。
例如AI系統(tǒng)也存在種族歧視問(wèn)題,圖表顯示了幾款較為成熟的商業(yè)化語(yǔ)音識(shí)別程序的錯(cuò)誤率。
雖然系統(tǒng)存在認(rèn)知偏差,但大多數(shù)研究人員只注重系統(tǒng)性能,而很少有人會(huì)去注意到這種偏差。這個(gè)問(wèn)題在未來(lái)很可能會(huì)阻礙各種形式的人工智能發(fā)展,包括計(jì)算機(jī)視覺(jué)和決策支持工具。
七 AI就業(yè)市場(chǎng)全球化
據(jù)LinkedIn數(shù)據(jù)顯示,從2016年到2020年,巴西、印度、加拿大、新加坡和南非的人工智能崗位增長(zhǎng)最快。而這并不意味著這些國(guó)家的絕對(duì)就業(yè)機(jī)會(huì)最多(美國(guó)和中國(guó)仍占據(jù)AI就業(yè)機(jī)會(huì)的首位),但這些國(guó)家對(duì)人工智能的投入將會(huì)對(duì)人工智能技術(shù)以及整個(gè)社會(huì)的發(fā)展產(chǎn)生積極影響。LinkedIn發(fā)現(xiàn),2020年的全球疫情并未對(duì)AI領(lǐng)域的工作崗位招聘造成絲毫影響。
值得注意的是,印度和中國(guó)的人才對(duì)LinkedIn的應(yīng)用并不廣泛,因此這些國(guó)家的人才市場(chǎng)狀況在LinkedIn上的數(shù)據(jù)并不具有充分的代表性。
八 企業(yè)對(duì)AI的投資熱度「不想停,也不會(huì)?!?/h3>

自2015年以來(lái)大量資金持續(xù)涌入人工智能領(lǐng)域。2020年,全球企業(yè)對(duì)人工智能的投資飆升至近680億美元,比前一年增長(zhǎng)40%。
九 創(chuàng)業(yè)狂潮接近尾聲
從前面一張圖表可以看出,AI領(lǐng)域的企業(yè)投資持續(xù)增長(zhǎng),但在增長(zhǎng)的背后,卻是增速逐年放緩。這張圖表顯示,AI初創(chuàng)企業(yè)得到的投資越來(lái)越少。雖然疫情可能對(duì)初創(chuàng)企業(yè)的活動(dòng)產(chǎn)生了影響,但AI初創(chuàng)企業(yè)數(shù)量下降的明顯趨勢(shì)始于2018年,從好的方面來(lái)看,這似乎是行業(yè)正在逐步走向成熟的信號(hào)。
十 新冠病毒帶來(lái)的影響
雖然人工智能的許多趨勢(shì)在很大程度上沒(méi)有受到全球疫情的影響,但這張圖表顯示,2020年的AI投資更偏向于全球應(yīng)對(duì)新冠病毒中發(fā)揮重要作用的單位。制藥相關(guān)公司投資的激增就很好的說(shuō)明了這一點(diǎn)。而對(duì)教育技術(shù)和游戲的投資增長(zhǎng),也與2020年疫情隔離導(dǎo)致人們把更多時(shí)間花費(fèi)在電腦前有直接關(guān)系。
十一風(fēng)險(xiǎn)?有風(fēng)險(xiǎn)嗎?
大量企業(yè)在電信、金融服務(wù)和汽車等行業(yè)穩(wěn)步增加人工智能工具的應(yīng)用。然而,大多數(shù)公司似乎不知道或不關(guān)心這項(xiàng)新技術(shù)帶來(lái)的風(fēng)險(xiǎn)。麥肯錫在一項(xiàng)研究中調(diào)查了企業(yè)對(duì)AI應(yīng)用相關(guān)風(fēng)險(xiǎn)的認(rèn)知,只有網(wǎng)絡(luò)安全風(fēng)險(xiǎn)受到了半數(shù)以上受訪者的關(guān)注。與人工智能相關(guān)的倫理問(wèn)題,如隱私和公平,是當(dāng)今人工智能研究領(lǐng)域最熱門的話題之一,然而這些問(wèn)題并未引起企業(yè)的足夠重視。
十二 AI領(lǐng)域的博士們正在涌入企業(yè)
AI領(lǐng)域的學(xué)術(shù)工作有限,雖然高校增加了本科生和研究生級(jí)別的人工智能相關(guān)課程,終身制教師職位也相應(yīng)增加,但學(xué)術(shù)界仍然無(wú)法吸收逐年新增的AI博士。這份圖表僅代表北美地區(qū)的AI博士畢業(yè)生,這些畢業(yè)生中的絕大多數(shù)正在流向AI企業(yè)。
十三 AI的倫理問(wèn)題
如前所述,很多公司對(duì)人工智能的倫理問(wèn)題重視程度不足,但研究人員對(duì)此越來(lái)越關(guān)心。許多團(tuán)體正在研究人工智能系統(tǒng)的不透明決策(稱為可解釋性問(wèn)題),嵌入偏見和歧視,以及隱私入侵等問(wèn)題。這份圖表顯示了人工智能會(huì)議上倫理問(wèn)題的相關(guān)論文正在逐年增加,Jack Clark認(rèn)為這非常值得高興。他指出,由于有這么多學(xué)生參加這些人工智能會(huì)議,幾年后,將有大量關(guān)注AI倫理的從業(yè)者進(jìn)入行業(yè)。
然而,除了會(huì)議文件的增加外,在這一問(wèn)題上業(yè)界并沒(méi)有其他突出的進(jìn)步。報(bào)告強(qiáng)調(diào),人工智能系統(tǒng)中的偏差量化測(cè)試才剛剛開始出現(xiàn)。Jack Clark說(shuō),「這些評(píng)估體系,就像人工智能科學(xué)領(lǐng)域的一個(gè)新分支?!?/span>
十四 多樣性問(wèn)題(1)
解決人工智能系統(tǒng)中嵌入的偏見和歧視的一種方法是確保構(gòu)建人工智能系統(tǒng)的群體的多樣性。這不是一個(gè)激進(jìn)的概念。然而,報(bào)告稱,在學(xué)術(shù)界和行業(yè),人工智能勞動(dòng)力「仍然以男性為主」。這張圖表來(lái)自美國(guó)計(jì)算機(jī)研究協(xié)會(huì)年度調(diào)查,數(shù)據(jù)顯示,在北美人工智能相關(guān)的博士課程的畢業(yè)生中,女性僅占約20%。
十五 多樣性問(wèn)題(2)
來(lái)自同一調(diào)查的數(shù)據(jù)講述了一個(gè)關(guān)于種族/民族身份的類似故事。這個(gè)問(wèn)題在即將畢業(yè)的博士生中似乎相當(dāng)明顯,有許多優(yōu)秀的科學(xué)、技術(shù)、工程和數(shù)學(xué)項(xiàng)目都以女孩和少數(shù)族裔為重點(diǎn)。這使我們想到了AI4ALL組織,或許社會(huì)可以更加關(guān)注這些群體,給他們更多的資助,或者以某種方式參與其中。
參考鏈接:
https://aiindex.stanford.edu/wp-content/uploads/2021/03/2021-AI-Index-Report_Master.pdf
https://spectrum.ieee.org/tech-talk/artificial-intelligence/machine-learning/the-state-of-ai-in-15-graphs