突發(fā)!OpenAI聯(lián)創(chuàng)、ChatGPT架構(gòu)師「叛逃」,官宣入職勁敵Anthropic
一大早,全世界都被這個(gè)消息震驚了:OpenAI的領(lǐng)導(dǎo)班子動(dòng)搖了一大片?
根據(jù)外媒Information的曝料,首先是OpenAI聯(lián)創(chuàng)John Schulman官宣離職,轉(zhuǎn)投OpenAI勁敵Anthropic。
此外,另一位聯(lián)創(chuàng)Greg Brockman(經(jīng)常出鏡那位)正在進(jìn)行長(zhǎng)期休假;而去年才加入的產(chǎn)品負(fù)責(zé)人Peter Deng也已離職。
根據(jù)Observer今年7月的統(tǒng)計(jì),OpenAI的11人創(chuàng)始團(tuán)隊(duì),當(dāng)時(shí)只剩下Sam Altman、Greg Brockman、John Schulman和Wojciech Zaremba四人。
圖片
馬庫(kù)斯本人對(duì)此點(diǎn)評(píng):OpenAI正在上演一場(chǎng)「權(quán)利的游戲」。
圖片
圖片
OpenAI再失創(chuàng)始元老
剛剛,領(lǐng)導(dǎo)「后訓(xùn)練」團(tuán)隊(duì)的AI科學(xué)家John Schulman官宣——自己已經(jīng)做出離開OpenAI的艱難決定。
而現(xiàn)在,他正式入職勁敵Anthropic,專注于AI對(duì)齊研究,扎入實(shí)際的技術(shù)工作。
Schulman在長(zhǎng)文中表示,自己并不是因?yàn)镺penAI缺乏對(duì)對(duì)齊研究的支持,才做出離職的決定。
圖片
離開OpenAI的選擇,是因?yàn)樽约焊酉M麑W⒂贏I對(duì)齊研究,希望能夠重新從實(shí)際技術(shù)工作,開始自己職業(yè)生涯新篇章。
接下來,我決定在Anthropic實(shí)現(xiàn)這一目標(biāo),在這里我相信可以獲得新的視角,并與對(duì)自己最感興趣的話題有深入研究的人一起工作。
需要明確的是,我并不是因?yàn)镺penAI缺乏對(duì)對(duì)齊研究的支持而離開。相反,公司領(lǐng)導(dǎo)在這個(gè)領(lǐng)域投入了很多精力。我的決定是個(gè)人的,基于我在職業(yè)生涯下一階段中希望如何集中精力。
我感謝Sam和Greg在最初招募我,以及Mira和Bob對(duì)我的信任,帶來了很多機(jī)會(huì),并幫助我成功應(yīng)對(duì)了各種挑戰(zhàn)。我為我們?cè)贠penAI共同取得的成就感到自豪:建立了一家具有公共利益使命的獨(dú)特且前所未有的公司。
我相信OpenAI以及我曾參與的團(tuán)隊(duì)在沒有我的情況下仍會(huì)繼續(xù)繁榮發(fā)展。后訓(xùn)練由一支擁有出色人才的團(tuán)隊(duì)負(fù)責(zé)。
我在ChatGPT上得到了過多的贊譽(yù)——Barret在將團(tuán)隊(duì)建設(shè)成現(xiàn)在這樣高效運(yùn)作上做了出色的工作,還有Liam、Luke和其他人。我很高興看到對(duì)齊團(tuán)隊(duì)正在一些有前途的項(xiàng)目上逐步成型。在Mia、Boaz等人的領(lǐng)導(dǎo)下,我相信這個(gè)團(tuán)隊(duì)非常有能力。
我非常感激能夠參與到這樣一個(gè)重要的歷史階段,并為我們共同取得的成就感到自豪。即使在其他地方工作,我仍會(huì)為你們加油。
幾個(gè)月前,OpenAI超級(jí)對(duì)齊團(tuán)隊(duì)負(fù)責(zé)人Jan Leike也加盟了Anthropic。Jan Leike激動(dòng)地表示,「又能在一起工作了」!
圖片
Sam Altman發(fā)文對(duì)Schulman在OpenAI期間做出的貢獻(xiàn)表示了感謝。
圖片
你是一位杰出的研究者,對(duì)產(chǎn)品和社會(huì)有著深刻見解,最重要的是,你是我們所有人的摯友。我們會(huì)非常懷念你,會(huì)繼續(xù)努力讓你為OpenAI感到自豪。
(2015年,我第一次在伯克利一家咖啡館見到了Schulman。他大概說了這么一句話:「一方面,現(xiàn)在談?wù)揂GI似乎很荒謬,但另一方面,我認(rèn)為這是非常合理的,這里是為什么以及為什么我認(rèn)為談?wù)撍苤匾梗缓笏年U述了構(gòu)成了OpenAI初始戰(zhàn)略的重要部分。這大約花了15分鐘,然后我們又尬聊了45分鐘。)
OpenAI研究副總裁Bob MacGrew幾乎在第一時(shí)間回復(fù)了Schulman的推特,對(duì)他的離職表示惋惜。
圖片
還有已經(jīng)離職OpenAI的研究員,對(duì)Schulman未來研究感到興奮。
圖片
網(wǎng)友們也紛紛在評(píng)論中玩起了梗。
圖片
圖片
圖片
ChatGPT架構(gòu)師,PPO一作
Schulman與OpenAI的結(jié)緣,是在研究生學(xué)業(yè)完成后,以創(chuàng)始人身份正式加入OpenAI。
至今,他已在OpenAI供職9年。值得一提的是,這是Schulman除實(shí)習(xí)之外,唯一工作的公司。
之前,他負(fù)責(zé)的是對(duì)齊團(tuán)隊(duì),隨后他開始主要領(lǐng)導(dǎo)「后訓(xùn)練」團(tuán)隊(duì),對(duì)部署在ChatGPT和OpenAI API中的模型進(jìn)行微調(diào)。
John Schulman本科在加州理工學(xué)院學(xué)習(xí)物理學(xué),之后到加州大學(xué)伯克利分校攻讀神經(jīng)科學(xué)方向的博士。
當(dāng)時(shí),他對(duì)人工智能也有點(diǎn)興趣,但在其中并沒有看到類似神經(jīng)科學(xué)的可遵循的道路。
直到參與伯克利的實(shí)驗(yàn)室輪換項(xiàng)目時(shí),他與Pieter Abbeel共同進(jìn)行了直升機(jī)和機(jī)器人方面的工作,由此決定轉(zhuǎn)到EECS(電子工程和計(jì)算機(jī)科學(xué))。
圖片
Schulman與OpenAI結(jié)緣已久。作為ChatGPT架構(gòu)師,早在2015年還在讀博士學(xué)位時(shí),他就加入OpenAI成為聯(lián)合創(chuàng)始人之一。
圖片
在一次采訪中,Schulman解釋了自己加入OpenAI的原因:
「我想做人工智能方面的研究,我認(rèn)為OpenAI這家公司的使命雄心勃勃,并且致力打造通用人工智能。」
「盡管,在當(dāng)時(shí)談?wù)揂GI似乎有些瘋狂,但我認(rèn)為開始考慮它是合理的,我希望在一個(gè)地方談?wù)揂GI是可以接受的。」
另外,據(jù)Schulman透露,OpenAI將人類反饋強(qiáng)化學(xué)習(xí)(RLHF)引入ChatGPT的想法可以追溯到2017年,當(dāng)時(shí)Jan Leike和Dario Amodei等人發(fā)表的一篇論文提到了這個(gè)方法。
圖片
論文地址:https://arxiv.org/abs/1706.03741
此外,2017年,Schulman在OpenAI任職期間也和團(tuán)隊(duì)首次提出了近端策略優(yōu)化(PPO)算法,其變體PPO-Clip成為了OpenAI使用的主要算法。
圖片
論文地址:https://arxiv.org/abs/1707.06347
OpenAI安全團(tuán)隊(duì)之所以致力于這項(xiàng)工作,是因?yàn)橄胱屇P头先祟惖钠?,真正傾聽人類意見,并試圖做人類想做的事情。
在GPT-3完成訓(xùn)練時(shí),Schulman看到了整個(gè)研究方向的潛力并決定加入這股潮流,
在很多次采訪中,Schulman都表達(dá)了對(duì)于人工智能下一前沿領(lǐng)域的看法:AI在更艱難的任務(wù)上不斷進(jìn)步的同時(shí),人類應(yīng)該做些什么?在哪些任務(wù)中,人類可以在大模型幫助下有更大影響力,做更多的工作。
此外,指路Schulman在個(gè)人博客上發(fā)布的機(jī)器學(xué)習(xí)研究指南,最初是在2017年為OpenAI研究員計(jì)劃編寫的。干貨滿滿,值得一觀。
圖片