12張圖看懂人工智能現(xiàn)狀
每年,斯坦福大學以人為中心的人工智能研究所(HAI) 都會發(fā)布其 AI 指數(shù),這是一份試圖總結人工智能現(xiàn)狀的大量數(shù)據(jù)和圖表匯編。本周出爐的2022 AI 指數(shù)一如既往地令人印象深刻,共有 190 頁,涵蓋研發(fā)、技術績效、倫理、政策、教育和經(jīng)濟。我閱讀了報告的每一頁,并挑選了 最具代表性的12 個圖表。
值得注意的是,我從去年的 2021 年指數(shù)中報告的許多趨勢仍然存在。例如,我們?nèi)匀簧钤谝粋€AI 的黃金時代,出版物不斷增加,AI 就業(yè)市場仍然是全球性的,企業(yè)對 AI 風險的認識與減輕上述風險的嘗試之間仍然存在令人不安的差距。我們不在這里重復這些要點。
下面,我們來開始今年的總結報道:
1. 投資脫鉤
涌入人工智能的資金數(shù)額依然令人難以置信。最值得注意的部份來自全球私人投資,這個數(shù)字從 2020 年的 460 億美元飆升至 2021 年的 935 億美元。增長來自于大型融資輪次的增加;2020 年有四輪融資超過 5 億美元,2021 年有 15 輪。報告還指出,所有這些資金都流向了更少的公司,因為自 2018 年以來新融資的初創(chuàng)公司數(shù)量一直在下降。這是一個偉大的時刻加入一家人工智能初創(chuàng)公司,但也許不是自己找到一家。
2. 美中關系復雜
這些天來,關于中美之間的人工智能競賽 的討論頗多。“當你看到所有關于地緣政治緊張局勢的新聞時,你會認為這兩個國家之間的合作數(shù)量會減少,”斯坦福大學 HAI 的政策研究員兼今年 AI Index 的主編Daniel Zhang說。相反,他告訴IEEE Spectrum,“過去 10 年,中美合作一直呈上升趨勢。” 在出版物的跨國合作方面,中國和美國的產(chǎn)出是中國和英國合作的兩倍多。
3. 申請專利和獲得專利是兩件不同的事情
中國專利申請量居世界第一;該報告指出,中國在 2021 年占全球專利申請量的 52%。但美國在授予的專利數(shù)量上占主導地位,占全球總數(shù)的 40%。張指出,授予專利“證明您的專利實際上是可信和有用的”,并表示這種情況有點類似于出版物和引用的情況。雖然中國在出版物數(shù)量、出版物引用和會議出版物方面領先,但美國在會議出版物的引用方面仍然領先,這表明美國研究人員的著名論文仍然具有巨大的影響力。
4. 計算機視覺的高原(Plateau)?
計算機視覺領域發(fā)展如此迅速,很難跟上最新的消息。AI 指數(shù)顯示,計算機視覺系統(tǒng)非常擅長涉及靜態(tài)圖像的任務,例如對象分類和面部識別,并且它們在視頻任務(例如活動分類)方面也越來越出色。
但是一個相對較新的基準顯示了計算機視覺系統(tǒng)可以做的事情的局限性:它們擅長識別事物,而不擅長推理它們所看到的。視覺常識推理挑戰(zhàn)賽于 2018年推出,要求 AI 系統(tǒng)回答有關圖像的問題并解釋其推理。例如,一張圖片顯示人們坐在餐桌旁,而服務員端著盤子走近;測試詢問為什么其中一個坐著的人指向桌子對面的人。該報告指出,近年來性能改進變得越來越微不足道,“這表明可能需要發(fā)明新技術來顯著提高性能?!?/p>
5.人工智能還沒有為法學院做好準備
自然語言處理 (NLP) 領域比計算機視覺晚了幾年才開始蓬勃發(fā)展,但它與計算機視覺的位置有點相似(圖 4)。文本摘要和基本閱讀理解等任務的基準顯示出令人印象深刻的結果,人工智能系統(tǒng)通常超過人類的表現(xiàn)。但是當 NLP 系統(tǒng)必須對他們所讀到的內(nèi)容進行推理時,他們就會遇到麻煩。
此圖表顯示了由 LSAT 考試中用作法學院入學考試的邏輯推理問題組成的基準測試的表現(xiàn)。雖然 NLP 系統(tǒng)在該基準的一組較簡單的問題上表現(xiàn)良好,但在一組較難的問題上表現(xiàn)最佳的模型的準確率僅為 69%。研究人員從要求 NLP 系統(tǒng)從不完整信息中得出結論的基準測試中得到了類似的結果。推理仍然是人工智能的前沿。
6. 道德無處不在
報告中有一個好消息:從參加ACM 公平、問責和透明度會議(FAccT) 等會議以及NeurIPS的道德相關研討會來判斷,現(xiàn)在人們對 AI 道德有極大的興趣。對于那些還沒有聽說過 FAccT 的人,報告指出,它是最早關注算法社會技術分析的主要會議之一。這張圖表顯示了 FAccT 的行業(yè)參與度不斷提高,張認為這是進一步的好消息?!斑@個領域一直由學術研究人員主導,”他說,“但現(xiàn)在我們看到更多的私營部門參與其中。” 張說,很難猜測這種參與對行業(yè)內(nèi)如何設計和部署人工智能系統(tǒng)意味著什么,但這是一個積極的信號。
7.Detox:如果你不這樣做該死,如果你這樣做該死
AI 的一大倫理問題涉及大型語言模型,例如 OpenAI 的GPT-3,它有一個非常糟糕的習慣,即生成文本,其中充滿了從其訓練數(shù)據(jù)(互聯(lián)網(wǎng))中學到的每一種偏見和偏見。多個研究小組(包括 OpenAI 本身) 正在研究這個toxic-language 問題,用新的基準來衡量偏見和detoxification計劃。但上圖顯示了通過三種不同的detox方法運行語言模型 GPT-2 的結果。所有這三種方法都損害了模型在一個稱為 perplexity 的指標上的性能(分數(shù)越低越好),對涉及非裔美國人對齊的英語和提及少數(shù)群體的文本的性能影響最差。正如專家所說,需要更多的研究。
8. 大學正在與 CS 學生一起爬行
人工智能管道從未如此充實。計算研究協(xié)會的年度調(diào)查收集了來自北美 200 多所大學的數(shù)據(jù),其最新數(shù)據(jù)顯示,2020 年有超過 31,000 名本科生完成了計算機科學學位。這比 2019 年的數(shù)字增加了 11.6%。
9. 人工智能需要女性
同一項調(diào)查著眼于人工智能領域的新博士,結果令人沮喪。在過去十年中,女性新的 AI 和 CS 博士的百分比僅增加了幾個百分點,至少在北美是這樣。這一點實際上是去年對 2021 年報告的報道的重復,但每個人都應該繼續(xù)談論它,直到事情發(fā)生變化。
10. 人工智能需要所有種族背景的人
同上這一點。AI Index 在不同的圖表上顯示 AI 和 CS 博士的數(shù)據(jù),但它們講述的是同一個故事。早在人們獲得博士學位之前,人工智能領域就需要在多樣性方面做得更好。
11. 立法者正在關注
2021 年,與人工智能相關的法案比以往任何時候都多。在 AI Index 一直關注的 25 個國家中,西班牙、英國和美國處于領先地位,去年分別通過了三項法案。報告還指出,在美國,通過的這三項法案是提出的高達 130 項法案之一。從報告中不清楚這些法案中的大多數(shù)是通過公共資金促進人工智能還是制定法規(guī)來管理人工智能可能帶來的風險。張說這是一個混合體,并表示 HAI 將在來年發(fā)布對全球立法的更詳細分析。
12. 氣候變化
人工智能指數(shù)跟蹤美國 55 個公共政策團體發(fā)表與人工智能相關的論文,這張圖表顯示了這些團體去年關注的主題。我用這張圖表作為借口來提出人工智能越來越大的能源足跡(訓練大型模型需要大量計算)以及它對氣候變化的潛在影響的話題。政策小組似乎并不認為這些是 2021 年的重要話題。我還問張,AI Index 是否會在明年的報告中討論這些問題,他說他的團隊正在與各個組織討論如何衡量和收集有關計算效率和氣候影響的數(shù)據(jù)。所以請繼續(xù)關注。
https://aiindex.stanford.edu/wp-content/uploads/2022/03/2022-AI-Index-Report_Master.pdf