自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

METR發(fā)現(xiàn) AI 編碼的“摩爾定律”?指數(shù)級(jí)增長(zhǎng)或顛覆軟件開(kāi)發(fā)

發(fā)布于 2025-4-30 06:29
瀏覽
0收藏

還記得 2023 年初 ChatGPT 剛出來(lái)時(shí),讓它30 秒寫(xiě)一個(gè)“冒泡排序”都覺(jué)得很新鮮?彈指之間,今天的 AI agent 已經(jīng)能自主幾分鐘內(nèi)啃下人類(lèi)程序員需要一小時(shí)乃至一天才能完成的需求了。

感覺(jué) AI 進(jìn)步太快跟不上?這可不是錯(cuò)覺(jué)。專(zhuān)注于 AI 能力評(píng)估的 METR 機(jī)構(gòu)扔出重磅研究:AI 系統(tǒng)能搞定的編碼任務(wù)復(fù)雜度(以人類(lèi)所需時(shí)間衡量)正以驚人的指數(shù)速度增長(zhǎng),其“時(shí)間范圍”(Time Horizon)——即 AI 能達(dá)到 50% 成功率的任務(wù)時(shí)長(zhǎng)——大約每 7 個(gè)月就翻一番

METR發(fā)現(xiàn) AI 編碼的“摩爾定律”?指數(shù)級(jí)增長(zhǎng)或顛覆軟件開(kāi)發(fā)-AI.x社區(qū)

METR 測(cè)試了 2019 到 2025 年間最強(qiáng)的 AI Agent,用近 200 個(gè)任務(wù)(主要是編碼,夾雜些推理)對(duì)它們進(jìn)行了“大考”。結(jié)果清晰地顯示:任務(wù)越耗時(shí),AI 越難搞定,但它們能搞定的任務(wù)時(shí)長(zhǎng)上限,確實(shí)在指數(shù)級(jí)飆升。

指數(shù)增長(zhǎng)的未來(lái)預(yù)測(cè):

如果這個(gè)“7 個(gè)月翻倍”的趨勢(shì)保持下去,那畫(huà)面太美不敢看:

  • 2026年:搞定2 小時(shí)任務(wù)
  • 2027年:拿下8 小時(shí)(1 工作日)任務(wù)
  • 2028年:挑戰(zhàn)40 小時(shí)(1 周)任務(wù)
  • 2029年:沖擊167 小時(shí)(1 個(gè)月)的大型項(xiàng)目

METR發(fā)現(xiàn) AI 編碼的“摩爾定律”?指數(shù)級(jí)增長(zhǎng)或顛覆軟件開(kāi)發(fā)-AI.x社區(qū)


加速!趨勢(shì)可能更快!

METR發(fā)現(xiàn) AI 編碼的“摩爾定律”?指數(shù)級(jí)增長(zhǎng)或顛覆軟件開(kāi)發(fā)-AI.x社區(qū)


更刺激的是,這個(gè)增長(zhǎng)似乎還在加速!METR 發(fā)現(xiàn),隨著模型能力大幅提升,在 2024-2025 年間,“時(shí)間范圍”的翻倍時(shí)間已縮短到僅僅 4 個(gè)月。如果按這個(gè)“渦輪增壓”的速度,搞定月度級(jí)任務(wù)可能2027 年就能實(shí)現(xiàn)!

METR發(fā)現(xiàn) AI 編碼的“摩爾定律”?指數(shù)級(jí)增長(zhǎng)或顛覆軟件開(kāi)發(fā)-AI.x社區(qū)

當(dāng)然,預(yù)測(cè)有風(fēng)險(xiǎn),趨勢(shì)也可能放緩。但反過(guò)來(lái)想,它也可能更快!特別是當(dāng) AI 開(kāi)始越來(lái)越多地參與到開(kāi)發(fā)下一代更強(qiáng) AI 的工作中時(shí),一個(gè)強(qiáng)大的“飛輪效應(yīng)”可能被觸發(fā):AI 加速創(chuàng)造更強(qiáng) AI,后者再進(jìn)一步加速……這種自我強(qiáng)化的循環(huán)可能導(dǎo)致能力的超指數(shù)級(jí)增長(zhǎng)。

歷史性時(shí)刻?

METR的這一發(fā)現(xiàn),它可能預(yù)示著一個(gè)生產(chǎn)力奇點(diǎn)的臨近,其影響之深遠(yuǎn),可能重塑軟件開(kāi)發(fā)乃至所有知識(shí)型工作,成為我們這個(gè)時(shí)代最值得關(guān)注的趨勢(shì)之一。

這一發(fā)現(xiàn)也支撐了朱嘯虎的最近一個(gè)熱門(mén)的觀點(diǎn)“5年以后沒(méi)有獨(dú)立的大模型公司,AI直接交付服務(wù)的形式體現(xiàn)商業(yè)價(jià)值”,按這一摩爾定律預(yù)測(cè),我想這個(gè)時(shí)間可能不需要5年!

開(kāi)發(fā)者和企業(yè),是時(shí)候認(rèn)真思考如何應(yīng)對(duì)這場(chǎng)可能到來(lái)的巨變了。

參考:

??https://metr.org/blog/2025-03-19-measuring-ai-ability-to-complete-long-tasks/??

??https://theaidigest.org/time-horizons??

本文轉(zhuǎn)載自?????AI工程化???,作者:ully

標(biāo)簽
收藏
回復(fù)
舉報(bào)
回復(fù)
相關(guān)推薦