自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

本科畢業(yè)加入谷歌,還寫(xiě)了「思維鏈」開(kāi)山之作,這位OpenAI新秀正為本科生答疑解惑

人工智能 新聞
本科畢業(yè)就加入谷歌,還以一作身份寫(xiě)出了「思維鏈」的開(kāi)山之作,現(xiàn)在在 OpenAI 參與打造 ChatGPT,Jason Wei 從他的視角為年輕 AI 研究者提供了一些建議。

如果你仔細(xì)研究過(guò)「chain of thought(CoT)」這個(gè)概念,那么你大概聽(tīng)過(guò) Jason Wei 這個(gè)名字。

圖片圖片

他是思維鏈概念開(kāi)山之作 ——「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」的第一作者,本科畢業(yè)就加入了谷歌。在那里,他推廣了思維鏈提示概念,共同領(lǐng)導(dǎo)了指令調(diào)優(yōu)的早期工作,并和 Yi Tay、Jeff Dean 等人合著了關(guān)于大模型涌現(xiàn)能力的論文。

圖片圖片

Jason Wei 等作者對(duì)思維鏈的定義是一系列的中間推理步驟,目的是為了提高大型語(yǔ)言模型進(jìn)行復(fù)雜推理的能力(通過(guò)將一個(gè)較為復(fù)雜的推理問(wèn)題分步拆解,一步步獲得最終答案)。Jason Wei 等人的論文是第一篇發(fā)現(xiàn)當(dāng)使用鏈?zhǔn)剿季S進(jìn)行提示時(shí),存在一個(gè)相變現(xiàn)象,表明大型模型在很大程度上優(yōu)于較小的模型,這進(jìn)一步導(dǎo)致了涌現(xiàn)能力的發(fā)現(xiàn)(引自《復(fù)雜推理:大語(yǔ)言模型的北極星能力》)。目前,思維鏈提示已經(jīng)在大模型領(lǐng)域得到廣泛易用。

2023 年初,他選擇加入 OpenAI,與其他技術(shù)人員一起構(gòu)建 ChatGPT。

憑借這些硬核的學(xué)術(shù)成果,Jason Wei 的被引量已經(jīng)接近 8000。

圖片圖片

作為一位年輕的學(xué)術(shù)新星,Jason Wei 最近收到了很多問(wèn)題。這些問(wèn)題大部分來(lái)自本科生,代表了他們對(duì)早期學(xué)術(shù)生涯的一些困惑。在一個(gè) google 文檔中,Jason Wei 回答了其中一些。本文摘取了其中幾個(gè)問(wèn)題,希望對(duì)抱有同樣困惑的同學(xué)有所幫助。

圖片圖片

問(wèn):你在 AI 領(lǐng)域的旅程是如何開(kāi)始的?

答:雖然你是通過(guò)我 2022 年的工作認(rèn)識(shí)我的,但我從 2017 年開(kāi)始就一直在從事 AI 領(lǐng)域的工作。

在達(dá)特茅斯學(xué)院讀本科時(shí),我最初想成為華爾街的銀行家,這是我父母那一代的美國(guó)夢(mèng)(也是我家鄉(xiāng)大多數(shù)朋友的選擇)。但是我在大一的時(shí)候(2017 年)很難找到金融實(shí)習(xí)機(jī)會(huì),所以最后,我通過(guò)我媽媽的朋友結(jié)識(shí)了一家 AI 創(chuàng)業(yè)公司,然后和這家公司展開(kāi)了合作。

那個(gè)夏天,我通過(guò)閱讀 Michael Neilson 的《神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)》第一次接觸了 AI。我了解了反向傳播算法,從任何類(lèi)型的輸入和輸出數(shù)據(jù)中學(xué)習(xí)任意映射的想法吸引了我。我至今還記得,我對(duì)這個(gè)領(lǐng)域的熱情比我在學(xué)校學(xué)過(guò)的其他任何學(xué)科都要高出一個(gè)數(shù)量級(jí)。

2010 年代末流行發(fā)論文,所以我也在大學(xué)期間試圖這么做。我走了一條普通的路,參加了一門(mén)機(jī)器學(xué)習(xí)課程,并請(qǐng)求教這門(mén)課的教授指導(dǎo)我進(jìn)行研究。我在醫(yī)學(xué)圖像分析的深度學(xué)習(xí)領(lǐng)域工作了兩年。我的研究成果還不錯(cuò),但也并非驚艷。達(dá)特茅斯學(xué)院沒(méi)有充滿(mǎn)活力的 AI 環(huán)境,很難找到志同道合的社區(qū)。所以我真的很感激那里真正對(duì) AI 感興趣的少數(shù)幾個(gè)人,其中 Sam Greydanus 是我仰慕的人。

畢業(yè)臨近時(shí),我同時(shí)申請(qǐng)了博士學(xué)位和軟件工程師職位。我有一篇被一家重要學(xué)術(shù)會(huì)議接受的優(yōu)秀論文,以為我會(huì)被所有的博士學(xué)位項(xiàng)目錄取。結(jié)果,幾乎所有學(xué)校都拒絕了我,除了南加州大學(xué)(USC)。大三的暑假,我在 Blend 和 DoorDash 實(shí)習(xí),但我不是一個(gè)出色的軟件工程師,對(duì)軟件也沒(méi)有那么大的熱情。

我差點(diǎn)就去南加州大學(xué)攻讀博士學(xué)位,但后來(lái)我改變了主意,因?yàn)槲耀@得了 Google AI Residency 項(xiàng)目的邀請(qǐng),這是一個(gè)為沒(méi)有 AI 博士學(xué)位的人提供谷歌研究機(jī)會(huì)的項(xiàng)目,為期 18 個(gè)月。這個(gè) AI 項(xiàng)目可能是我職業(yè)生涯迄今為止最大的跳板。我可能是憑借我寫(xiě)的關(guān)于自然語(yǔ)言處理中數(shù)據(jù)增強(qiáng)的一篇相對(duì)受歡迎的論文被錄取的。那篇論文的影響對(duì)我來(lái)說(shuō)是個(gè)驚喜 —— 我天真地將我在醫(yī)學(xué)圖像分析中使用的一種直覺(jué)應(yīng)用到了自然語(yǔ)言處理中,沒(méi)想到它會(huì)變得如此受歡迎。

因此,在 2020 年畢業(yè)后,我在谷歌工作了兩年多,從事大型語(yǔ)言模型研究。谷歌是一個(gè)進(jìn)行研究的絕佳場(chǎng)所,許多著名的研究人員通過(guò)在谷歌的工作樹(shù)立了自己的聲譽(yù)。這個(gè) AI 項(xiàng)目特別有效,因?yàn)楸憩F(xiàn)優(yōu)秀的研究人員有機(jī)會(huì)繼續(xù)留在谷歌工作,大多數(shù)人都會(huì)為了能夠成為永久員工而努力。

我的故事至少包含兩個(gè)教訓(xùn),雖然都有些老生常談,但我還是想說(shuō)一下:

  • 第一,很多我當(dāng)時(shí)認(rèn)為是失敗的事情實(shí)際上對(duì)我來(lái)說(shuō)是好事。如果我當(dāng)初在金融或軟件工程實(shí)習(xí)方面更加成功,可能就錯(cuò)過(guò)了我現(xiàn)在喜歡的 AI 職業(yè)生涯。 
  • 第二,運(yùn)氣起到了很大的作用,但我也創(chuàng)造了很多機(jī)會(huì)來(lái)獲得好運(yùn)。例如,我在撰寫(xiě)一篇被廣泛引用的自然語(yǔ)言處理論文方面并沒(méi)有絕對(duì)的優(yōu)勢(shì),但通過(guò)寫(xiě)一篇關(guān)于它的博客,使用通俗易懂的語(yǔ)言,并在線(xiàn)上提供代碼,我為這篇論文贏(yíng)得了受歡迎的機(jī)會(huì)。

問(wèn):我應(yīng)該選擇哪個(gè)研究方向?

答:顯然,這個(gè)問(wèn)題沒(méi)有一個(gè)標(biāo)準(zhǔn)答案。

我個(gè)人認(rèn)為,選擇一個(gè)你喜歡的研究方向很重要,因?yàn)閺拈L(zhǎng)遠(yuǎn)來(lái)看,你會(huì)在這方面做得更好。如果你不知道自己喜歡什么樣的研究,可以廣泛閱讀幾周,或者詢(xún)問(wèn)他人他們對(duì)哪些方向感興趣,然后選擇一個(gè)開(kāi)始進(jìn)行研究。

有時(shí)候,你可能需要在你想要從事的研究方向和其他因素之間做出權(quán)衡。例如,你可能有機(jī)會(huì)與一位優(yōu)秀的教授合作,但研究方向可能并非你首選的主題。我認(rèn)為,如果你能從中學(xué)到很多東西,或者它能幫助你實(shí)現(xiàn)自己的目標(biāo),這樣做是可以接受的。但重要的是要記住你做事情的原因,并且對(duì)自己的意愿保持透明。

有一個(gè)研究方向,我會(huì)一概推薦給人們考慮,那就是「對(duì)齊」(alignment)。我認(rèn)為「對(duì)齊」是一個(gè)很好的方向,有幾個(gè)原因支持這個(gè)看法:

  1. 將智能 AI 與人類(lèi)價(jià)值觀(guān)對(duì)齊顯然非常重要。
  2. 對(duì)齊是一個(gè)相對(duì)新興的領(lǐng)域,因此早期從事對(duì)齊研究的人將有更大的機(jī)會(huì)產(chǎn)生影響。
  3. 對(duì)齊可能涉及多個(gè)學(xué)科,與倫理學(xué)等其他領(lǐng)域有關(guān),這可能會(huì)吸引一些人。
  4. 對(duì)齊研究人員的供應(yīng)少于需求,所以找到工作可能會(huì)更容易。

有一些人不從事對(duì)齊研究可能是因?yàn)檫@不是傳統(tǒng)的研究方向,缺乏很好的基準(zhǔn),不太容易入門(mén)。而且,對(duì)齊的目標(biāo)并未得到所有人的一致認(rèn)同。但我不認(rèn)為這些原因會(huì)成為障礙;我發(fā)現(xiàn)從事對(duì)齊研究的人非常樂(lè)于和那些對(duì)對(duì)齊感興趣的人交流。

問(wèn):你大部分需要進(jìn)行有效研究的知識(shí)是從哪里學(xué)來(lái)的?如果有有趣的想法,是花更多時(shí)間學(xué)習(xí),還是直接開(kāi)始研究?

答:在研究中,有三種學(xué)習(xí)來(lái)源:

  1. 閱讀資料:其他研究論文、博客文章、推特等。
  2. 其他人告訴你:你的導(dǎo)師給你反饋,審稿人審查你的論文。
  3. 你嘗試做一些事情:你進(jìn)行一項(xiàng)實(shí)驗(yàn),它有可能成功,也有可能失敗,你要深入挖掘原因。

在開(kāi)始階段,閱讀資料是很有益的,因?yàn)檫M(jìn)行第二和第三種學(xué)習(xí)會(huì)有更高的成本(涉及到他人的時(shí)間和你自己進(jìn)行實(shí)驗(yàn)所需的時(shí)間)。然而,你很快就希望盡早開(kāi)始第二和第三種學(xué)習(xí)。原因是,當(dāng)你處于能力的邊界時(shí),學(xué)習(xí)發(fā)生得最快,而且由于(2)和(3)是為你個(gè)性化定制的,它們將更快地加速你的學(xué)習(xí)過(guò)程。

問(wèn):你認(rèn)為進(jìn)行研究最重要的特質(zhì)是什么?

答:我認(rèn)為研究,就像其他大多數(shù)技能一樣,可以通過(guò)實(shí)踐來(lái)學(xué)習(xí)(參見(jiàn):https://www.jasonwei.net/blog/practicing-ai-research)。我們當(dāng)中很少有人能達(dá)到陶哲軒那種天賦水平。但我相信大多數(shù)人都有能力成為高水平的研究人員。因此,對(duì)于這個(gè)問(wèn)題,我的簡(jiǎn)短回答可能是「毅力」,因?yàn)橐懔δ軌虼龠M(jìn)實(shí)踐。

在研究中被嚴(yán)重低估的一個(gè)技能是從反饋中學(xué)習(xí)。你會(huì)驚訝于人們對(duì)反饋的忽視程度 —— 我發(fā)現(xiàn)大多數(shù)向我尋求建議的人并不聽(tīng)取意見(jiàn)。我嘗試非常認(rèn)真地對(duì)待別人給出的反饋,如果他們是行業(yè)的佼佼者更是如此。反饋就像是一個(gè)梯度,它告訴你成為更好的研究人員應(yīng)該往哪個(gè)方向前進(jìn)。當(dāng)我有導(dǎo)師時(shí),我每周都會(huì)向他們?cè)儐?wèn)我可以做得更好的地方,然后努力去做。在研究中,我們很幸運(yùn)有著快速的反饋循環(huán)文化;并不是每個(gè)領(lǐng)域都是如此。

需要注意的是,我們也要懂得在何時(shí)忽略反饋。你的導(dǎo)師或老板在提供反饋時(shí)可能并不總是處于適宜的精神狀態(tài),而且他們對(duì)你的問(wèn)題可能沒(méi)有像你那樣深入思考。但你仍然應(yīng)該仔細(xì)考慮他們說(shuō)的話(huà)。

另一個(gè)被低估的技能是愿意做一些基礎(chǔ)性的工作,特別是查看數(shù)據(jù)。2019 年,我訓(xùn)練了一種用于肺癌分類(lèi)的神經(jīng)網(wǎng)絡(luò),我對(duì)大部分?jǐn)?shù)據(jù)進(jìn)行了初步標(biāo)注,然后請(qǐng)病理學(xué)家審查我的分類(lèi)。這花費(fèi)了我 40 多個(gè)小時(shí),最后我能夠像臨床病理學(xué)家一樣對(duì)某種類(lèi)型的肺癌進(jìn)行分類(lèi)。雖然花費(fèi)了很多時(shí)間,但我從進(jìn)行數(shù)據(jù)標(biāo)注中獲得的直覺(jué)在此后的三篇論文中都得到了應(yīng)用,所以這是值得的。

研究中最后一個(gè)被低估的技能是成為一個(gè)良好的溝通者。良好的溝通使你更值得信賴(lài),值得合作。例如,我有三個(gè)小忌諱,其他人可能也有:

  • 很多人喜歡說(shuō)「我明天把這個(gè)活兒干完」,然后事實(shí)上要等到幾周后才完成。我盡量避免說(shuō)這樣的話(huà),除非確實(shí)很重要,而且我確實(shí)能在明天之前完成(不只是開(kāi)始做)。我希望在他人需要完成一項(xiàng)重要任務(wù)時(shí),他們能相信我的承諾。
  • 在項(xiàng)目的初期會(huì)議中,人們常常表現(xiàn)出很大的興趣參與,但后來(lái)卻不愿意付出與他們表達(dá)的興趣成比例的時(shí)間。同樣,我希望我的興趣對(duì)他人有所提示,所以我盡量說(shuō)一些類(lèi)似于「我不能保證會(huì)參與這個(gè)項(xiàng)目,但是 <X> 的想法對(duì)我來(lái)說(shuō)真的很有趣」的話(huà)。
  • 人們經(jīng)常會(huì)說(shuō)「<X > 不起作用」,卻沒(méi)有提供足夠的細(xì)節(jié)。我試圖把陳述改成「在使用公式 F、模型 M 和數(shù)據(jù)集 D 時(shí),<X > 沒(méi)有起作用」,這樣可以減少對(duì)方猜測(cè)我所說(shuō)的具體內(nèi)容的心力消耗。

問(wèn):有效的想法(至少在你從事的領(lǐng)域)是否更傾向于在數(shù)學(xué)上有更深的內(nèi)涵,還是更具廣泛的創(chuàng)造力?如果數(shù)學(xué)深度很重要,在本科階段如何達(dá)到這種理解水平?是培養(yǎng)良好的數(shù)學(xué)直覺(jué)更重要,還是值得花時(shí)間深入研究這些數(shù)學(xué)主題?

答:很難說(shuō)學(xué)更多數(shù)學(xué)知識(shí)是不好的,但我有點(diǎn)個(gè)人想法:在深度學(xué)習(xí)的歷史中,有兩個(gè)簡(jiǎn)單的因素經(jīng)得起時(shí)間的考驗(yàn),并且?guī)缀蹩偸怯行У模焊蟮哪P秃透嗟臄?shù)據(jù)。這兩者都不涉及深?yuàn)W的數(shù)學(xué)基礎(chǔ),甚至不算特別具有創(chuàng)造性。

因此,我不建議在數(shù)學(xué)上過(guò)于深入,原因有幾點(diǎn):

  1. 目前在這個(gè)領(lǐng)域存在著很多機(jī)會(huì)和未開(kāi)發(fā)的想法,這意味著時(shí)間的機(jī)會(huì)成本很高。因此,投入時(shí)間在數(shù)學(xué)上的相對(duì)價(jià)值較低。
  2. 即使你想花更多時(shí)間來(lái)培養(yǎng)長(zhǎng)期技能,我認(rèn)為有些能力比擅長(zhǎng)數(shù)學(xué)更有優(yōu)勢(shì)。以下是一些建議:
  • 當(dāng)今的人工智能領(lǐng)域在很大程度上與精通工程和發(fā)展良好的軟件工程技能有關(guān)。
  • 當(dāng)前的瓶頸之一是 GPU,了解硬件以及如何高效使用 GPU 可能比學(xué)習(xí)數(shù)學(xué)更具回報(bào)。
  • 努力成為一名優(yōu)秀的溝通者,會(huì)讓你更容易與人共事,幫助你更清晰地思考,更有條理。

鑒于大多數(shù)想法并非源于數(shù)學(xué)動(dòng)機(jī)(雖然也有一些),在尋找工程解決方案時(shí),過(guò)度依賴(lài)數(shù)學(xué)知識(shí)可能會(huì)使你產(chǎn)生錯(cuò)誤的偏見(jiàn)(就像精通語(yǔ)言學(xué)并不能幫助你建立大型語(yǔ)言模型一樣)。

目前,這個(gè)問(wèn)答帖還在更新,Jason Wei 也在陸續(xù)貢獻(xiàn)自己的答案,大家可以有選擇性地借鑒,或者提出自己的新問(wèn)題。

完整文檔參見(jiàn)以下鏈接:https://docs.google.com/document/d/1QREmdzLwJ0CR3kdFeenJbBowT1IFFREd46y10tW6pog/edit

責(zé)任編輯:張燕妮 來(lái)源: 機(jī)器之心
相關(guān)推薦

2018-06-20 09:23:07

AI專(zhuān)業(yè)科技

2019-02-26 14:23:06

跳槽薪資職業(yè)

2009-04-13 11:14:35

2025-02-26 14:24:43

AIChatGPT生成式人工智能

2019-12-18 15:28:05

編程語(yǔ)言PythonJava

2018-07-09 17:16:50

2020-12-02 10:05:26

AI 數(shù)據(jù)人工智能

2022-03-22 18:19:29

論文深度學(xué)習(xí)人工智能

2019-02-27 14:06:53

AIAdamSGD

2024-05-20 08:00:00

GPT-4o團(tuán)隊(duì)

2023-02-27 09:29:05

GPT模型

2024-09-09 14:15:00

AI訓(xùn)練

2020-04-01 12:18:11

人工智能強(qiáng)化學(xué)習(xí)開(kāi)源

2018-03-20 20:50:18

阿里巴巴馬云

2025-04-10 09:00:00

GPTAI模型

2019-06-17 09:00:00

代碼開(kāi)發(fā)工具

2021-07-27 11:13:04

算法人臉識(shí)別技術(shù)

2021-01-29 15:21:02

AI 數(shù)據(jù)人工智能

2018-10-29 12:35:50

騰訊網(wǎng)易百度

2010-07-14 16:13:43

諸葛亮求職記
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)