自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

ChatGPT只算L1階段,谷歌提出AGI完整路線圖

人工智能
按照谷歌這個標(biāo)準(zhǔn)來看,大多數(shù)已有AI產(chǎn)品其實都分別進(jìn)入了不同的AGI階段,但只僅限于在技能水平上——要談及通用性,目前只有ChatGPT等模型完全合格。

AGI應(yīng)該如何發(fā)展、最終呈什么樣子?

現(xiàn)在,業(yè)內(nèi)第一個標(biāo)準(zhǔn)率先發(fā)布:

AGI分級框架,來自谷歌DeepMind。

圖片

該框架認(rèn)為,發(fā)展AGI必須遵循6個基本原則:

  • 關(guān)注能力,而非過程
  • 同時衡量技能水平和通用性
  • 專注于認(rèn)知和元認(rèn)知任務(wù)
  • 關(guān)注最高潛力,而非實際落地水平
  • 注重生態(tài)有效性
  • 關(guān)注整條AGI之路的發(fā)展,而非單一的終點

在此原則之上,AGI將呈現(xiàn)6大發(fā)展階段,每個階段都有對應(yīng)的深度(性能)和廣度(通用性)指標(biāo)。

圖片

我們當(dāng)前的AI產(chǎn)品走到哪一階段了?這里也有答案。

詳細(xì)來看。

6項基本原則

什么是AGI?

對于這個問題,許多科學(xué)家、研究機(jī)構(gòu)都給出了自己的理解。

比如圖靈提出的圖靈測試認(rèn)為機(jī)器是否能“思考”就是一個衡量指標(biāo);強(qiáng)人工智能的概念提出者則認(rèn)為,AGI是一個擁有意識的系統(tǒng);還有人說AGI一定是能在復(fù)雜性和速度上與人腦一樣甚至超越人腦……

谷歌認(rèn)為,這些定義都不全面。

像圖靈測試,一些LLM已經(jīng)可以通過,但我們能稱那些模型為AGI嗎?

像類人腦說法,Transformer架構(gòu)的成功就已表明,嚴(yán)格基于大腦的思考過程對于AGI來說并不是必須的。

通過分析這些定義(一共9種,詳情可翻閱原文)的優(yōu)缺點,谷歌重新理出了6項基本原則:

1、關(guān)注能力,而非過程

這可以幫助我們?nèi)コ恍┎灰欢ㄊ菍崿F(xiàn)AGI的必備要求:

比如AGI不一定要用類似人類的方式思考或理解,也不意味著系統(tǒng)必須具有主觀意識等能力(主要是這種能力無法也通過固定的方法去測量)。

2、注重通用性和技能水平

目前所有的AGI定義都強(qiáng)調(diào)了通用性,這一點不必多說。但谷歌強(qiáng)調(diào),性能也是AGI的關(guān)鍵組成部分(也就是可以達(dá)到人類的幾分水平)。在后面的具體階段制定中,主要也是根據(jù)這倆指標(biāo)進(jìn)行分類的。

3、專注于認(rèn)知和元認(rèn)知任務(wù)

前者目前基本為共識,即AGI可以執(zhí)行各種非體力任務(wù)。不過谷歌在此強(qiáng)調(diào),AI系統(tǒng)執(zhí)行物理任務(wù)的能力也需要加強(qiáng),因為它對于認(rèn)知能力是有推動作用的。

此外,元認(rèn)知能力,如學(xué)習(xí)新任務(wù)或知道何時向人類尋求幫助,是系統(tǒng)走向通用性的關(guān)鍵先決條件。

4、關(guān)注最高潛力,而非實際落地水平

證明一個系統(tǒng)可以在給定的標(biāo)準(zhǔn)上完成任務(wù),就足以宣布該系統(tǒng)為AGI,我們不要求一定得在開放世界中完全部署出水平相同的系統(tǒng)。

因為,這可能會面臨一些非技術(shù)阻礙,比如法律和社會考慮、潛在道德問題。

5、注重生態(tài)有效性

所謂生態(tài)有效性,谷歌指的是選擇真正有用的現(xiàn)實任務(wù)去benchmark系統(tǒng)的進(jìn)步,這些任務(wù)不僅包括經(jīng)濟(jì)價值也包括社會和藝術(shù)價值,要避開那些容易自動匹配和量化的傳統(tǒng)AI指標(biāo)。

6、關(guān)注整條AGI之路的發(fā)展,而非單一的終點

這也是為什么谷歌要制定我們接下來將要看到的6個發(fā)展階段。

6大必經(jīng)階段

AGI之路的6個階段由深度指標(biāo)(即技能水平,與人類相比)和廣度指標(biāo)(通用性)進(jìn)行劃分。

第零階段為“No AI”,計算軟件、編譯器等屬于該范疇,在通用性上只能執(zhí)行human-in-the-loop任務(wù)。

第一階段為“涌現(xiàn)級”(Emerging),技能相當(dāng)于或略比沒有相關(guān)技能的人類要強(qiáng)。

ChatGPT、Bard和Llama 2等大模型就屬于該階段,并且已經(jīng)滿足了該階段要達(dá)到的通用性。

第二階段可理解為“剛剛合格級”(Competent),可以達(dá)到正常成年人50%的水平。

像語音助手Sir、能在短文寫作/簡單編碼等任務(wù)中達(dá)到SOTA水平的大模型都屬于這一階段。

不過,它們都只是在技能指標(biāo)上合格了,通用性還夠不上,也沒有其它能夠達(dá)到這一階段通用性水平的AI產(chǎn)品。

圖片

第三階段為“專家級”(Expert),可達(dá)到正常成年人90%的水平。

谷歌認(rèn)為,拼寫和語法檢查器如Grammarly、圖像生成模型Imagen等可以劃為該階段,主要也是在技能水平上達(dá)標(biāo)了,通用性還不夠。

第四階段為“大師級”(Virtuoso),可達(dá)到正常人類99%的水平。

深藍(lán)、AlphaGo等都屬于。同樣,還沒有哪個AI產(chǎn)品可以達(dá)到屬于這一級別的通用能力。

最后一階段為“超人級”(Superhuman),在技能指標(biāo)上,已經(jīng)可以超越頂尖科學(xué)家的AlphaFold、AlphaZero也可劃入該階段。

毫無疑問,具備超人智能級通用性的AI還沒誕生。

圖片

從中我們看出,按照谷歌這個標(biāo)準(zhǔn)來看,大多數(shù)已有AI產(chǎn)品其實都分別進(jìn)入了不同的AGI階段,但只僅限于在技能水平上——要談及通用性,目前只有ChatGPT等模型完全合格。

但它們也只還處于最底層的“一級AGI”階段。

不過,正如原則2所說,評價AGI就是要看這技能水平和通用性這兩個指標(biāo),這樣劃分也算說得過去。

值得一提的是,我們可以看到,像DALLE-2這樣的圖像生成模型已經(jīng)可以歸類于“三級AGI”。

谷歌給出的理由是,因為它生成的圖像已經(jīng)比大多數(shù)人都要強(qiáng)了(也就是超越90%人類)。

這一劃分并未考慮大多數(shù)用戶由于提示技巧不佳,無法達(dá)成最佳性能的情況。

因為遵循原則4,我們只需要關(guān)注一個系統(tǒng)的潛力到了就夠了。

另外,對于最終階段的AGI,谷歌暢想,它除了蛋白質(zhì)結(jié)構(gòu)預(yù)測,還可能能同時進(jìn)行與動物交流、分析大腦信號、進(jìn)行高質(zhì)量預(yù)測等各種人類難以企及的任務(wù),這樣才不枉費我們的期待。

最后,對于這個層級劃分,谷歌也承認(rèn)還有很多事情要做:

比如在通用性維度上,應(yīng)該用哪些標(biāo)準(zhǔn)任務(wù)集進(jìn)行測量?完成多大比例的任務(wù)才行?有哪些任務(wù)是一定要滿足的?

這些問題一時都不大可能全部摸清。

你同意谷歌提出的這些原則和階段劃分嗎? 

原文: 
https://arxiv.org/abs/2311.02462。

責(zé)任編輯:姜華 來源: 量子位
相關(guān)推薦

2025-01-13 08:00:00

訓(xùn)練模型AI

2014-11-12 13:26:55

創(chuàng)業(yè)

2014-11-12 13:31:22

2023-02-26 12:44:03

ChatGPTAGI路線圖

2024-07-12 12:51:44

2014-11-12 13:39:57

創(chuàng)業(yè)

2010-12-31 10:05:22

Exchange

2011-05-11 16:29:38

iOS

2012-02-08 09:49:02

惠普webOS開源

2010-12-31 13:22:36

2010-07-23 14:34:38

2024-06-26 09:00:00

2013-01-16 17:34:32

Android開發(fā)路線圖

2012-02-22 16:44:44

Flash

2009-01-19 15:03:40

ASP.NET學(xué)習(xí)ASP.NET入門ASP.NET學(xué)習(xí)曲線

2024-08-01 16:06:22

2023-02-25 21:48:36

人工智能技術(shù)

2009-03-16 11:03:53

Symbian開源開發(fā)平臺

2009-03-16 08:39:57

Symbian開發(fā)平臺開源

2020-07-29 14:11:25

微軟GitHub產(chǎn)品路線圖
點贊
收藏

51CTO技術(shù)棧公眾號