自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

首個(gè)AI軟件工程師震撼硅谷!手握十塊IOI金牌,他們鐵了心砸掉程序員飯碗

人工智能
在SWE-bench基準(zhǔn)測(cè)試中,它無(wú)需人類(lèi)幫助,可解決13.86%的問(wèn)題。相比之下,GPT-4只能處理1.74%的問(wèn)題,且都需要人類(lèi)提示告知處理哪些文件??梢哉f(shuō),它遠(yuǎn)遠(yuǎn)超過(guò)了此前所有AI大模型。

一覺(jué)醒來(lái),程序員怕是真要失業(yè)了。

首個(gè)AI軟件工程師一亮相,直接引爆整個(gè)科技圈。只需一句指令,它可端到端地處理整個(gè)開(kāi)發(fā)項(xiàng)目。

圖片

在SWE-bench基準(zhǔn)測(cè)試中,它無(wú)需人類(lèi)幫助,可解決13.86%的問(wèn)題。

相比之下,GPT-4只能處理1.74%的問(wèn)題,且都需要人類(lèi)提示告知處理哪些文件。

可以說(shuō),它遠(yuǎn)遠(yuǎn)超過(guò)了此前所有AI大模型。

圖片

從零構(gòu)建網(wǎng)站、自主查找并修復(fù)Bug、甚至是訓(xùn)練和微調(diào)自己的AI模型通通都不在話下~也可為一些成熟的代碼庫(kù)做貢獻(xiàn)。

圖片

就是一些不熟悉的技術(shù),給它看一篇博客文章。它也能立馬搞定。

比如用ControlNet,生成帶有隱藏文字的圖像,Devin就是一點(diǎn)就通~

圖片

據(jù)介紹,它已經(jīng)成功通過(guò)一家AI公司面試,并且在Upwork上完成了實(shí)際工作。

圖片

而這背后的公司Cognition,雖然是初創(chuàng)公司,但小而精悍。

在招人信息中明晃晃寫(xiě)著:我們有10個(gè)IOI金牌得主。

讓同行們直呼:哦莫,瘋了吧~

圖片

目前Devin尚未公測(cè),不過(guò)已經(jīng)有少部分人拿到了資格,開(kāi)始實(shí)測(cè)了一波……

圖片

首個(gè)AI軟件工程師亮相

Devin被介紹為世界首個(gè)完全自主的AI軟件工程師。

它在長(zhǎng)程推理和規(guī)劃上面下了很大功夫,可以規(guī)劃和執(zhí)行需要數(shù)千個(gè)決策才能完成的復(fù)雜軟件工程任務(wù)。

在這之中,進(jìn)行到任何一步它都可以回調(diào)所有相關(guān)的上下文信息,保證整體邏輯性,并方便隨時(shí)校正錯(cuò)誤。

既然是一個(gè)端到端AI,軟件開(kāi)發(fā)人員常用的工具,比如shell、代碼編輯器和瀏覽器等等,Devin也都配備(沙盒計(jì)算環(huán)境中),主打一個(gè)全方位服務(wù)。

最終的Devin,讓人類(lèi)只需要發(fā)號(hào)施令,其他什么也不用做。

具體來(lái)看,其主要能力有以下六個(gè):

1.端到端構(gòu)建和部署程序

Devin可以幫我們解決的不只有是代碼,還包括與之相關(guān)的整個(gè)工作流。

比如,當(dāng)我們需要設(shè)計(jì)一個(gè)網(wǎng)頁(yè)游戲時(shí),Devin不僅能生成網(wǎng)頁(yè),還能直接完成服務(wù)端的部署,然后直接發(fā)布上線,省去了中間的人工操作。

只需要告訴Devin,我們想做一個(gè)個(gè)人網(wǎng)站,里面運(yùn)行一個(gè)Devin定制版的生命游戲。

然后Devin表示自己會(huì)先搭建網(wǎng)站的基本架構(gòu),并詢(xún)問(wèn)了有沒(méi)有更具體的需求。

圖片

在明確要求之后,Devin給出了這樣一份任務(wù)清單:

  • 創(chuàng)建React應(yīng)用,安裝UI模塊等依賴(lài)。
  • 用React和UI模組搭建前端環(huán)境。
  • 部署服務(wù)器并確保其在私有IP下運(yùn)行。
  • 通過(guò)CDN向首頁(yè)添加p5.js庫(kù)。
  • 在React中部署并驗(yàn)證游戲的功能和資源是否正確配置。

圖片

接著,Devin就會(huì)按照自己設(shè)計(jì)的這個(gè)清單開(kāi)始編寫(xiě)代碼,然后部署服務(wù)……

圖片

△Devin部署后端服務(wù)器的過(guò)程

最終完成全部工作之后,一個(gè)即點(diǎn)即玩的游戲鏈接就呈現(xiàn)在了我們面前。

圖片

2.自主查找并修復(fù)bug

不僅能一氣呵成完成開(kāi)發(fā)部署,Devin的debug能力也是一流。

開(kāi)發(fā)者給Devin一個(gè)GitHub鏈接,讓它先熟悉項(xiàng)目情況,然后一會(huì)兒要準(zhǔn)備數(shù)據(jù)進(jìn)行測(cè)試。

圖片

接著,Devin就會(huì)按部就班地編寫(xiě)測(cè)試用的程序并準(zhǔn)備好有關(guān)數(shù)據(jù),然后運(yùn)行。

結(jié)果,在開(kāi)發(fā)者已經(jīng)發(fā)布的完整項(xiàng)目之中,Devin還真的找到了連開(kāi)發(fā)者自己都沒(méi)有發(fā)現(xiàn)的漏洞。

圖片

發(fā)現(xiàn)漏洞之后,Devin會(huì)回溯報(bào)錯(cuò)出現(xiàn)的位置及對(duì)應(yīng)的數(shù)據(jù),然后分析原因并給出解決方案。

最終經(jīng)過(guò)調(diào)試,程序的bug被成功修復(fù),完美通過(guò)了測(cè)試。

圖片

3.訓(xùn)練和微調(diào)自己的AI模型

除了這些一般的程序或項(xiàng)目,作為一個(gè)全能型AI助手,Devin還有能力幫助人類(lèi)訓(xùn)練和微調(diào)其他AI。

對(duì)于一些常見(jiàn)的模型(比如示例中的Llama),用戶(hù)只需要在promot中提及模型的名稱(chēng),Devin就直接知道要訓(xùn)練哪個(gè)模型。

而在這個(gè)示例中,微調(diào)的具體方法(QLoRA)是以GitHub鏈接的形式輸入給Devin的。

圖片

接到指令后,Devin還是像處理平常的程序一樣邊規(guī)劃邊執(zhí)行,所需環(huán)境和依賴(lài),還有模型本體,都會(huì)自動(dòng)下載安裝。

圖片

這些準(zhǔn)備都完成之后,微調(diào)工作就會(huì)有條不紊地進(jìn)行,而且其中的狀態(tài)可以實(shí)時(shí)監(jiān)控。

圖片

4.修復(fù)開(kāi)源庫(kù)

Devin的能力不僅在于開(kāi)發(fā)者自己本身的項(xiàng)目,開(kāi)源社區(qū)里的,它也能hold住。

比如我們只需要把GitHub項(xiàng)目的issue鏈接丟給Devin,它就能立即完成所需的所有配置,并自動(dòng)收集上下文信息,然后開(kāi)始解決問(wèn)題。

圖片

當(dāng)然,開(kāi)源項(xiàng)目的功能請(qǐng)求(feature request)也沒(méi)問(wèn)題,和修問(wèn)題的流程一樣,自己搞好配置,收集上下文,然后就開(kāi)始編碼。

5.成熟的生產(chǎn)庫(kù)也能做貢獻(xiàn)

還沒(méi)完,業(yè)已成熟的生產(chǎn)庫(kù),Devin也能給咱秀一把。

官方介紹,sympy Python代數(shù)系統(tǒng)中有一個(gè)對(duì)數(shù)計(jì)算的錯(cuò)誤,就被Devin順利解決:

配置環(huán)境、重現(xiàn)bug,自行編碼并修復(fù)、測(cè)試,再次一氣呵成。

圖片
△就是這個(gè)庫(kù)

6.不熟的技術(shù),現(xiàn)學(xué)現(xiàn)賣(mài)

最后,遇到自己不會(huì)的技能,Devin可以直接現(xiàn)學(xué),并迅速付諸應(yīng)用。

把你新刷到的技術(shù)文章鏈接直接丟給Devin:

Hi Devin!我在這個(gè)博客文章中(附網(wǎng)址)發(fā)現(xiàn),可以生成帶有隱藏文本的圖像。文中提到了一個(gè)腳本,你能配置好它,然后為我真的生成一些圖片嗎?

圖片

Ps. 就是利用ControlNet來(lái)做這件事。

Devin接到請(qǐng)求后,首先詢(xún)問(wèn)了更為詳細(xì)的需求,然后開(kāi)始閱讀博客文章,并像平常一樣規(guī)劃出了行動(dòng)方案。

圖片

有了詳細(xì)的行動(dòng)方案后,它立刻就在數(shù)分鐘內(nèi)進(jìn)行代碼編寫(xiě)和調(diào)試。

同樣的,在這里遇到bug也不用驚慌,Devin同樣有能力直接進(jìn)行修復(fù)。

圖片

完成工具的搭建后,Devin也沒(méi)有勞煩人類(lèi)自行配置使用,而是一氣呵成,最終生成了咱們要的帶隱藏文字的圖像:

圖片

可以說(shuō)表現(xiàn)相當(dāng)令人驚艷。

而在具體測(cè)試中,Devin取得的成績(jī)同樣亮眼。

在評(píng)估Devin的表現(xiàn)時(shí),團(tuán)隊(duì)沒(méi)有使用常見(jiàn)的HumanEval,而是用了更具挑戰(zhàn)性的SWE-bench。

這個(gè)數(shù)據(jù)集是由GitHub中的實(shí)際問(wèn)題組成的,Devin不借助任何輔助,就取得了13.86%的最高解決率。

而同樣在無(wú)輔助的條件下,GPT-4的問(wèn)題解決率為零,此前的最佳水平是1.96%,加入輔助也才4.8%。

圖片

公司人均一塊IOI金牌

如此炸天的新成果,背后卻是一家名不見(jiàn)經(jīng)傳的初創(chuàng)公司。

但這種“名不見(jiàn)經(jīng)傳”背后,實(shí)際是一個(gè)10人員工的編程天才團(tuán)隊(duì),IOI金牌就有10塊…人均一塊。

Devin背后公司名為Cognition AI,總部設(shè)在紐約和舊金山,定位是一家專(zhuān)注于推理的應(yīng)用AI實(shí)驗(yàn)室。

此前這家公司一直秘密工作,于兩個(gè)月前正式注冊(cè)成立。

目前該團(tuán)隊(duì)規(guī)模僅有10人,但共攬獲了10枚IOI金牌,創(chuàng)始成員均曾在Cursor、Scale AI、Lunchclub、Modal、Google DeepMind、Waymo、Nuro等從事AI前沿工作。

據(jù)悉,Cognition AI由Scott Wu、Steven Hao、WaldenYan創(chuàng)立。

圖片

聯(lián)合創(chuàng)始人兼CEO Scott Wu,根據(jù)我們目前搜到的資料,Scott Wu曾就讀于哈佛大學(xué),曾是Lunchclub的聯(lián)合創(chuàng)始人兼CTO。

圖片

曾連續(xù)三年攬獲IOI金牌:

圖片

聯(lián)合創(chuàng)始人兼CTO Steven Hao,畢業(yè)于MIT計(jì)算機(jī)專(zhuān)業(yè),之前曾在Scale AI、Jane Street、DE Shaw、Quora工作。

圖片

也曾是IOI金牌得主:

圖片

聯(lián)合創(chuàng)始人兼CPO Walden,曾于哈佛大學(xué)攻讀計(jì)算機(jī)科學(xué)和經(jīng)濟(jì)學(xué)相關(guān)專(zhuān)業(yè),還曾從事MIT PRIMES密碼學(xué)和機(jī)器學(xué)習(xí)方向的計(jì)算機(jī)科學(xué)研究,還是沃頓商學(xué)院高中投資大賽北美地區(qū)決賽入圍者。

圖片

2020年第32屆IOI金牌得主:

圖片

據(jù)X推文的轉(zhuǎn)發(fā)順藤摸瓜,還有一位創(chuàng)始成員被扒了出來(lái)。

Neal Wu,同樣有哈佛大學(xué)教育經(jīng)歷,曾在tryramp、GoogleBrain工作過(guò)。

圖片

整個(gè)團(tuán)隊(duì)長(zhǎng)期目標(biāo),意在通過(guò)解決推理問(wèn)題,在廣泛的學(xué)科領(lǐng)域解鎖新的可能性,而“代碼僅僅是開(kāi)始”。

不過(guò)對(duì)于Devin,目前他們尚未透露是如何實(shí)現(xiàn)這一壯舉的,包括到底是使用自己的專(zhuān)有模型還是第三方模型。

此外,Cognition AI目前已獲得硅谷投資大佬彼得·蒂爾的Founders Fund基金領(lǐng)投的2100萬(wàn)美元A輪融資。

眾所周知,彼得蒂爾以挖掘這種極具突破性的創(chuàng)新項(xiàng)目著稱(chēng),而且哈佛背景的創(chuàng)業(yè)者更是和他淵源緊密。

上一個(gè)他早期投資中類(lèi)似背景,最知名的是扎克伯格和Facebook。

“自動(dòng)化軟件工程與自動(dòng)駕駛類(lèi)似”

Devin一亮相,讓不少工程師大驚失色:軟件工程師…要失業(yè)了???

圖片

圖片
圖片

不過(guò)也有人依然樂(lè)觀:終于有AI讓我們從繁重的編程任務(wù)中解脫出來(lái)。

圖片

前特斯拉AI總監(jiān)卡帕西倒是給了一顆定心丸。

自動(dòng)化軟件工程,目前看起來(lái)與自動(dòng)化駕駛類(lèi)似。

具體體現(xiàn)在發(fā)展進(jìn)程上:首先人類(lèi)手動(dòng)編寫(xiě)代碼,然后 GitHub Copilot 自動(dòng)完成幾行,再之后ChatGPT 編寫(xiě)代碼塊,現(xiàn)在就是Devin的出現(xiàn)。

接下來(lái),他認(rèn)為自動(dòng)化軟件工程會(huì)演變成為協(xié)調(diào)開(kāi)發(fā)人員需要串聯(lián)的許多工具一起編寫(xiě)代碼:終端、瀏覽器、代碼編輯器等。以及人類(lèi)負(fù)責(zé)監(jiān)督,逐漸轉(zhuǎn)向更高級(jí)別工作。

結(jié)合卡帕西的經(jīng)歷和對(duì)自動(dòng)駕駛的理解,他表達(dá)的更多是一種漸進(jìn)式推進(jìn),即會(huì)有一段時(shí)間的人機(jī)共駕,然后在數(shù)據(jù)和迭代反饋后,才能實(shí)現(xiàn)完全無(wú)人駕駛。

自動(dòng)化軟件也類(lèi)似,先低代碼,然后零代碼,最后完全不需要人寫(xiě)代碼。

圖片

Perplexity AI CEO給出了個(gè)高度的肯定:這應(yīng)該是任何Agent的第一個(gè)演示。

它似乎跨越了人類(lèi)水平的門(mén)檻并且可靠地工作。它還告訴我們通過(guò)結(jié)合 LLM 和樹(shù)搜索算法可以實(shí)現(xiàn)什么

圖片

德?lián)銩I之父、前FAIR(Meta)研究科學(xué)家、現(xiàn)已加入OpenAI的Noam Brown轉(zhuǎn)發(fā)開(kāi)麥:

2024年是AI激動(dòng)人心的一年。

圖片

所以,程序員們做好被解放的準(zhǔn)備了嗎?(Doge)

參考鏈接:
[1]https://twitter.com/cognition_labs/status/1767548763134964000/quotes。
[2]https://waldenyan.com/。
[3]https://twitter.com/itsandrewgao/status/1767628564432670904。
[4]https://twitter.com/Lauramaywendel/status/1767588416730894756。
[5]https://www.bloomberg.com/news/articles/2024-03-12/cognition-ai-is-a-peter-thiel-backed-coding-assistant。

責(zé)任編輯:姜華 來(lái)源: 量子位
相關(guān)推薦

2024-03-13 12:29:36

AI訓(xùn)練

2024-03-13 10:41:29

AI程序員

2020-02-25 22:45:21

程序員技能開(kāi)發(fā)者

2024-03-19 09:29:32

AI程序員

2014-09-22 09:47:14

2016-05-06 10:21:13

程序工程師編程

2024-12-03 14:13:47

幽靈工程師人工智能

2024-09-20 11:30:14

2009-07-16 13:28:14

2019-01-28 11:54:28

程序員技能溝通

2009-02-11 13:15:54

軟件工程師女工程師google

2015-10-22 10:23:34

程序員工程師不同

2015-11-16 13:32:51

2009-11-04 10:57:35

2018-05-04 14:35:51

2023-06-05 10:07:13

軟件工程平臺(tái)工程師

2022-01-16 07:12:30

軟件工程師吵架開(kāi)發(fā)

2013-10-25 11:19:18

Google大數(shù)據(jù)Sanjay Ghem

2009-02-12 14:45:17

軟件工程師

2013-09-03 09:30:44

軟件工程師軟件工程師頭銜
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)