自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

斯坦福2025 AI Index報(bào)告來了:DeepSeek在全文中被提到45次

人工智能 新聞
每一年的斯坦福 AI Index 報(bào)告都會對領(lǐng)域的發(fā)展進(jìn)行系統(tǒng)的梳理,今年也是如此。《2025 AI Index》報(bào)告總共 400 多頁,涵蓋了研發(fā)、技術(shù)性能、負(fù)責(zé)任的人工智能、經(jīng)濟(jì)影響、科學(xué)和醫(yī)學(xué)、政策、教育和公眾輿論等主題的圖表和數(shù)據(jù)。

剛剛,斯坦福大學(xué)正式發(fā)布了《2025 AI Index》報(bào)告。

在過去的一段時間里,人工智能領(lǐng)域經(jīng)歷了一場蓬勃的發(fā)展,但與此同時,也有人說「人工智能是一個泡沫」。其他的討論話題包括但不限于:人工智能的現(xiàn)有技術(shù)和架構(gòu)將不斷取得突破;人工智能走在一條不可持續(xù)的道路上;人工智能將取代你的工作;人工智能最擅長的就是把你的家庭照片變成吉卜力工作室風(fēng)格的動畫圖像……

每一年的斯坦福 AI Index 報(bào)告都會對領(lǐng)域的發(fā)展進(jìn)行系統(tǒng)的梳理,今年也是如此?!?025 AI Index》報(bào)告總共 400 多頁,涵蓋了研發(fā)、技術(shù)性能、負(fù)責(zé)任的人工智能、經(jīng)濟(jì)影響、科學(xué)和醫(yī)學(xué)、政策、教育和公眾輿論等主題的圖表和數(shù)據(jù)。

圖片

報(bào)告地址:https://hai.stanford.edu/ai-index/2025-ai-index-report

目錄如下:

圖片

除了谷歌、OpenAI 之外,中國公司 DeepSeek 也成為報(bào)告關(guān)注的焦點(diǎn),在 PDF 全文中被提到了 45 次。

關(guān)于今年 AI Index 報(bào)告的核心內(nèi)容,我們通過 12 張圖片來了解:

美國公司的遙遙領(lǐng)先

圖片

雖然衡量國家在人工智能競賽中「領(lǐng)先」的方式多種多樣(如期刊文章發(fā)表或引用數(shù)量、專利授權(quán)等),但一個直觀的評估指標(biāo)是觀察哪些國家發(fā)布了具有影響力的模型。研究機(jī)構(gòu) Epoch AI 擁有一個從 1950 年至今的重要人工智能模型數(shù)據(jù)庫,AI Index 從中提取了相關(guān)數(shù)據(jù)進(jìn)行分析。

數(shù)據(jù)顯示,去年美國發(fā)布了 40 個知名模型,中國發(fā)布了 15 個,歐洲僅有 3 個(均來自法國)。另有數(shù)據(jù)表明,2024 年發(fā)布的這些模型幾乎全部來自產(chǎn)業(yè)界,而非學(xué)術(shù)界或政府部門。關(guān)于 2023 年至 2024 年知名模型發(fā)布數(shù)量減少的現(xiàn)象,AI Index 認(rèn)為可能是由于技術(shù)復(fù)雜度提高和訓(xùn)練成本持續(xù)攀升所致。

說到訓(xùn)練成本……

圖片

在這方面,AI Index 缺乏精確數(shù)據(jù),因?yàn)樵S多領(lǐng)先的人工智能公司已停止公開其訓(xùn)練過程信息。斯坦福研究人員與 Epoch AI 合作,基于訓(xùn)練時長、硬件類型和數(shù)量等詳細(xì)信息,估算了部分模型的成本。在可評估的模型中,最昂貴的是谷歌的 Gemini 1.0 Ultra,訓(xùn)練成本約達(dá) 1.92 億美元。訓(xùn)練成本的全面上漲與報(bào)告中的其他發(fā)現(xiàn)相符:模型在參數(shù)數(shù)量、訓(xùn)練時間和訓(xùn)練數(shù)據(jù)量等方面持續(xù)規(guī)?;瘮U(kuò)張。

值得注意的是,DeepSeek 并未包含在這一分析中。這家公司在 2025 年 1 月聲稱僅用 600 萬美元訓(xùn)練出了 DeepSeek-R1,引發(fā)金融市場震動,雖然部分行業(yè)專家對此說法持懷疑態(tài)度。

AI Index 指導(dǎo)委員會聯(lián)合主任 Yolanda Gil 在接受 IEEE Spectrum 采訪時表示,她認(rèn)為 DeepSeek「非常令人印象深刻」,并指出計(jì)算機(jī)科學(xué)歷史上充滿了早期低效技術(shù)被更優(yōu)雅解決方案取代的案例。她補(bǔ)充道:「我不是唯一一個相信某個時點(diǎn)會出現(xiàn)更高效版本大語言模型的人。我們只是不知道誰會構(gòu)建它以及如何構(gòu)建。」

使用人工智能的成本正在下降

圖片

盡管大多數(shù) AI 模型的訓(xùn)練成本持續(xù)攀升,但報(bào)告中強(qiáng)調(diào)了幾個積極趨勢:硬件成本降低、硬件性能提升及能源效率提高。

這使得推理成本(即查詢已訓(xùn)練模型的費(fèi)用)正在急劇下降。這張使用對數(shù)比例的圖表展示了 AI 性能每美元的發(fā)展趨勢。報(bào)告指出,藍(lán)線表明每百萬 tokens 的成本從 20 美元降至 0.07 美元;粉線則顯示在不到一年時間內(nèi),成本從 15 美元降至 0.12 美元。

人工智能的顯著碳足跡

圖片

雖然能源效率提高是一個積極的趨勢,但存在一個不容忽視的問題:盡管效率有所提升,整體能耗仍在增長,這意味著處于人工智能熱潮中心的數(shù)據(jù)中心留下了巨大的碳足跡。AI Index 基于訓(xùn)練硬件、云服務(wù)提供商和地理位置等因素,估算了特定 AI 模型的碳排放,發(fā)現(xiàn)前沿人工智能模型的訓(xùn)練碳排放量呈穩(wěn)步增長趨勢 —— 其中 DeepSeek 模型是個例外。

數(shù)據(jù)顯示,最大的排放源是 Meta 的 Llama 3.1 模型,估計(jì)產(chǎn)生了 8930 噸二氧化碳排放,相當(dāng)于約 496 個美國人一年的生活碳排放量。這一顯著的環(huán)境影響解釋了為何人工智能公司正積極采用核能作為可靠的零碳能源來源。

人工智能模型性能差距持續(xù)縮小

圖片美國在已發(fā)布的知名模型數(shù)量上仍然保持領(lǐng)先地位,但中國模型在質(zhì)量方面正在迅速趕上。數(shù)據(jù)顯示,在聊天機(jī)器人基準(zhǔn)測試上的性能差距正在不斷縮小。2024 年 1 月,頂尖美國模型的表現(xiàn)比最優(yōu)中國模型高出 9.26%;到 2025 年 2 月,這一差距已縮小至僅 1.70%。報(bào)告在推理、數(shù)學(xué)和編程等其他基準(zhǔn)測試中也發(fā)現(xiàn)了類似趨勢。

人類最后的考試

圖片

今年的報(bào)告指出了一個不可忽視的事實(shí):用于評估人工智能系統(tǒng)能力的眾多基準(zhǔn)測試已經(jīng)「飽和」—— 人工智能系統(tǒng)在這些測試上獲得的分?jǐn)?shù)如此之高,以至于它們不再具有區(qū)分價值。這種現(xiàn)象已在多個領(lǐng)域出現(xiàn):通用知識、圖像推理、數(shù)學(xué)、編程等。

Gil 表示,她驚訝地目睹一個又一個基準(zhǔn)測試逐漸失去參考意義。她指出:「我一直認(rèn)為性能會趨于平穩(wěn),會達(dá)到一個需要新技術(shù)或根本不同架構(gòu)才能繼續(xù)取得進(jìn)展的臨界點(diǎn)。但事實(shí)并非如此?!?/span>

面對這種局面,執(zhí)著的研究人員不斷設(shè)計(jì)新的基準(zhǔn)測試,以期挑戰(zhàn)人工智能系統(tǒng)。其中一項(xiàng)是「人類的最后考試」,它由來自全球 500 個機(jī)構(gòu)的專業(yè)領(lǐng)域?qū)<邑暙I(xiàn)的極具挑戰(zhàn)性問題組成。到目前為止,即使對最頂尖的人工智能系統(tǒng)而言,這項(xiàng)測試仍然難以攻克:OpenAI 的推理模型 o1 目前以 8.8% 的正確答案率位居榜首。業(yè)界正密切關(guān)注這種局面能持續(xù)多久。

公共數(shù)據(jù)面臨的威脅

圖片

當(dāng)今生成式 AI 系統(tǒng)通過訓(xùn)練海量從互聯(lián)網(wǎng)抓取的數(shù)據(jù)獲得智能,這導(dǎo)致了一個經(jīng)常被提及的觀點(diǎn):「數(shù)據(jù)是 AI 經(jīng)濟(jì)的新石油」。隨著人工智能公司不斷挑戰(zhàn)可輸入模型的數(shù)據(jù)量極限,業(yè)界開始擔(dān)憂「數(shù)據(jù)峰值」問題,以及何時會耗盡這種關(guān)鍵資源。一個問題是,越來越多的網(wǎng)站正在限制機(jī)器人爬取并抓取其數(shù)據(jù)(可能是因?yàn)閾?dān)憂人工智能公司從其數(shù)據(jù)中獲利,同時破壞其商業(yè)模式)。網(wǎng)站通過機(jī)器可讀的 robots.txt 文件聲明這些限制。

數(shù)據(jù)顯示,頂級網(wǎng)絡(luò)域名中 48% 的數(shù)據(jù)現(xiàn)已被完全限制訪問。然而,Gil 指出,人工智能領(lǐng)域可能會出現(xiàn)新方法,終結(jié)對龐大數(shù)據(jù)集的依賴。她認(rèn)為:「預(yù)計(jì)在某些時候,數(shù)據(jù)量將不再如此關(guān)鍵?!?/span>

企業(yè)資金持續(xù)涌入人工智能領(lǐng)域

圖片

過去五年,企業(yè)界已為人工智能投資敞開了資金閘門。雖然 2024 年的全球總體投資未能達(dá)到 2021 年的瘋狂高峰,但值得注意的是,私人投資規(guī)模達(dá)到了前所未有的水平。在 2024 年 1500 億美元的私人投資中,相關(guān)指數(shù)的另一項(xiàng)數(shù)據(jù)表明,約 330 億美元流向了生成式 AI 領(lǐng)域。

企業(yè)等待人工智能投資的巨大回報(bào)

圖片

理論上,企業(yè)投資人工智能是因?yàn)槠谕@得可觀的投資回報(bào)。在這個話題上,人們常以激昂語氣討論人工智能的變革性本質(zhì)和前所未有的生產(chǎn)力提升。然而,企業(yè)尚未見到能帶來顯著成本節(jié)省或?qū)嵸|(zhì)性新收益的轉(zhuǎn)變。

麥肯錫調(diào)查數(shù)據(jù)顯示,在報(bào)告成本降低的企業(yè)中,大多數(shù)節(jié)省幅度不足 10%;在因人工智能獲得收入增長的企業(yè)中,大多數(shù)報(bào)告的增長幅度不到 5%。巨大的回報(bào)可能仍在路上,從投資數(shù)據(jù)來看,眾多企業(yè)正在押注于此,但目前尚未實(shí)現(xiàn)。

AI 醫(yī)生或?qū)⒑芸旖釉\

圖片

科學(xué)與醫(yī)療領(lǐng)域的人工智能應(yīng)用是人工智能浪潮中的一個重要分支。報(bào)告列舉了多個新發(fā)布的基礎(chǔ)模型,這些模型旨在協(xié)助材料科學(xué)、天氣預(yù)報(bào)和量子計(jì)算等領(lǐng)域的研究人員。眾多公司正嘗試將人工智能的預(yù)測和生成能力轉(zhuǎn)化為盈利性藥物研發(fā)。OpenAI 的 o1 推理模型最近在醫(yī)學(xué)執(zhí)照考試問題集 MedQA 的基準(zhǔn)測試中取得了 96% 的得分。

然而,這似乎仍是一個潛力巨大但尚未轉(zhuǎn)化為顯著實(shí)際影響的領(lǐng)域 —— 部分原因可能是人類尚未完全掌握如何有效使用這項(xiàng)技術(shù)。2024 年的一項(xiàng)研究測試了醫(yī)生在使用 GPT-4 作為常規(guī)資源補(bǔ)充時是否能做出更準(zhǔn)確的診斷。結(jié)果表明,這既未提高診斷準(zhǔn)確性,也未加快診斷速度。值得注意的是,單獨(dú)使用的 GPT-4 表現(xiàn)卻優(yōu)于人機(jī)團(tuán)隊(duì)和單獨(dú)的人類醫(yī)生。

美國的人工智能政策行動轉(zhuǎn)向州級層面

圖片

這張圖表顯示,美國國會雖有大量關(guān)于人工智能的討論,但實(shí)際行動寥寥無幾。報(bào)告指出,美國的政策制定已轉(zhuǎn)移至州級層面,2024 年共有 131 項(xiàng)法案在各州獲得通過。其中 56 項(xiàng)與深度偽造(deepfake)相關(guān),禁止在選舉中使用深度偽造技術(shù)或借此傳播未經(jīng)同意的私密圖像。

美國之外,歐洲已通過《人工智能法案》(AI Act),該法案要求開發(fā)被認(rèn)定為高風(fēng)險的人工智能系統(tǒng)的公司承擔(dān)新的責(zé)任義務(wù)。然而,全球主要趨勢是各國聯(lián)合發(fā)表關(guān)于人工智能應(yīng)在世界上扮演何種角色的全面但無約束力的聲明。因此,實(shí)質(zhì)性監(jiān)管行動相對有限,而討論卻十分廣泛。

人類是樂觀主義者

圖片

無論你是股票攝影師、營銷經(jīng)理還是卡車司機(jī),關(guān)于人工智能是否以及何時會取代你的工作,社會上已有廣泛討論。然而,最近一項(xiàng)關(guān)于人工智能態(tài)度的全球調(diào)查顯示,大多數(shù)人并不感到受到人工智能的威脅。

來自 32 個國家的 60% 受訪者認(rèn)為人工智能將改變他們的工作方式,但僅有 36% 的人預(yù)期會被替代?!高@些調(diào)查結(jié)果確實(shí)讓我感到驚訝,」Gil 表示,「人們認(rèn)為『人工智能將改變我的工作,但我仍將創(chuàng)造價值』,這種觀點(diǎn)非常令人鼓舞。」讓我們拭目以待,看看我們能否都通過管理人工智能團(tuán)隊(duì)來持續(xù)創(chuàng)造價值。

更多細(xì)節(jié),可參考報(bào)告原文。

責(zé)任編輯:張燕妮 來源: 機(jī)器之心
相關(guān)推薦

2019-12-16 14:33:01

AI人工智能斯坦福

2018-01-23 16:48:47

AI

2025-04-09 04:22:00

2021-03-10 14:48:27

人工智能

2021-03-05 10:57:33

AI 數(shù)據(jù)人工智能

2021-02-02 12:17:05

人工智能算法技術(shù)

2017-11-28 14:18:29

2023-03-06 10:26:37

AI研究

2025-02-28 09:52:00

2019-03-24 12:11:47

AI 數(shù)據(jù)人工智能

2022-03-17 19:03:14

人工智能報(bào)告趨勢

2025-04-09 11:25:36

2019-03-27 10:47:05

人工智能法律AI

2022-07-04 09:12:09

AI技術(shù)論文

2024-11-29 16:35:50

模型訓(xùn)練

2024-07-22 08:00:00

機(jī)器人虛擬

2009-05-19 09:06:41

Apple斯坦福iPhone

2013-01-31 09:45:14

斯坦福超級電腦百萬內(nèi)核

2012-03-21 21:38:27

蘋果

2022-12-22 15:37:12

AI代碼
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號