自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<em id="ua8pz"><p id="ua8pz"></p></em><pre id="ua8pz"></pre>

<sub id="ua8pz"></sub>

<cite id="ua8pz"></cite>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

GPT-4把DeepMind整尷尬了：你登上Nature的排序優(yōu)化算法，我兩段話就找出來了

作者：量子位 2023-06-10 00:11:52

DeepMind方面對AlphaDev這通操作，讓人想起當(dāng)年AlphaGo的“第37步”——一種違反直覺的下法卻直接擊敗傳奇圍棋選手李世石，讓觀眾全都震驚不已。

DeepMind新AI登上Nature才一天，GPT-4就來打擂臺了！

只通過兩段提示，GPT-4就給出了和AlphaDev如出一轍的排序算法優(yōu)化方法。

而AlphaDev被DeepMind稱作是“重現(xiàn)AlphaGo神來之筆”，發(fā)現(xiàn)了提速70%的排序算法。

哦豁，這下AlphaDev更尷尬了。

讓GPT-4“發(fā)現(xiàn)”同樣操作的老哥直接陰陽：

完全不需要強化學(xué)習(xí)啊。我能將這個發(fā)現(xiàn)登在Nature上嗎？

馬斯克“路過看到”，也留下了句“因吹斯聽”。

所以GPT-4怎么做到的？

2段提示就搞定

帶來這個新發(fā)現(xiàn)的是一位來自威斯康星大學(xué)麥迪遜分校的副教授，名叫Dimitris Papailiopoulos（下面簡稱D教授）。

他讓GPT-4實現(xiàn)這一操作的步驟非常簡單，一共就輸入了兩次提示。

首先，他和GPT-4說：

這有一段排序算法，我覺得它還能進(jìn)一步優(yōu)化。你能不能在下面幾行，用*注明哪些指令可以刪除或者改進(jìn)？如果不需要修改，就什么都不動。一步一步解釋原因，然后回去驗證它是對的。

第一步的時候他還強調(diào)說，如果有什么新發(fā)現(xiàn)，先不要做改變，只是“看著”就好，寫出來一些書面改進(jìn)建議。

要非常詳細(xì)、非常小心。

然后GPT-4對給出的代碼做出了詳細(xì)解釋。

然后D教授給了第二條提示：

繼續(xù)。如果你有很大的把握，按照上面的提示去做。Temperatur=0（讓生成結(jié)果確定且一致），盡量簡要避免混淆。

然后GPT-4給出了詳細(xì)的步驟，最后總結(jié)說：

我們發(fā)現(xiàn)指令“mov S P”多余可以去掉，其他指令都是必需的。但在刪除之后，應(yīng)將P替換成S。

對比DeepMind新工作AlphaDev在處理同樣問題上的思路，不能說毫無關(guān)系，只能說一模一樣：

DeepMind方面對AlphaDev這通操作，讓人想起當(dāng)年AlphaGo的“第37步”——一種違反直覺的下法卻直接擊敗傳奇圍棋選手李世石，讓觀眾全都震驚不已。

同樣，AlphaDev則是通過交換和復(fù)制移動，跳過了一個步驟，以一種看似錯誤但實際上是捷徑的方式達(dá)成目標(biāo)。

據(jù)介紹，AlphaDev是一種強化學(xué)習(xí)算法、基于AlphaZero打造，它的發(fā)現(xiàn)并非基于現(xiàn)有算法，而是從最底層的匯編指令開始摸索的。

它的創(chuàng)新主要在于兩種指令序列：

（1）AlphaDev Swap Move（交換移動）

（2）AlphaDev Copy Move（復(fù)制移動）

原理上，DeepMind的研究員給它設(shè)計了一種單人“組裝”游戲：

只要能夠搜索并選擇出合適的指令（下圖A流程），正確且快速地排好數(shù)據(jù)（下圖B流程），就能獲得獎勵。

但這個游戲的挑戰(zhàn)不僅在于搜索空間的大?。山M合指令數(shù)相當(dāng)于宇宙中的粒子數(shù)），也在于獎勵函數(shù)的性質(zhì)，因為一條錯誤指令就可能會使整個算法失效。

網(wǎng)友：我們總是低估GPT-4的能力

對于GPT-4的“騷操作”，有人表示：即便是資深開發(fā)者也低估GPT-4了。

有人感慨說，D教授的操作進(jìn)一步驗證，只要有耐心、懂提示工程，GPT-4能做到的事還有很多。

也有人提出質(zhì)疑，表示GPT-4能這么做會不會是因為它的訓(xùn)練數(shù)據(jù)中包含了一些排序算法的優(yōu)化方法？

不過話說回來，之所以這件事能夠引起這么大的關(guān)注和討論，很大一部分原因是AlphaDev登上Nature存在爭議。

不少人覺得這也不是什么開創(chuàng)性的研究，DeepMind夸大其詞。

不僅是D教授陰陽說“我是不是也能登Nature”，還有網(wǎng)友說自己十幾歲的時候優(yōu)化了快排，這也應(yīng)該發(fā)論文的。

當(dāng)然也有人認(rèn)為，AlphaDev本身的創(chuàng)新點更在于，它是利用強化學(xué)習(xí)來發(fā)現(xiàn)新算法的。

你覺得呢？

參考鏈接：[1]https://chat.openai.com/share/95693df4-36cd-4241-9cae-2173e8fb760c[2]https://twitter.com/DimitrisPapail/status/1666843952824168465

責(zé)任編輯：武曉燕來源：量子位

GPT-4 DeepMind AlphaGo

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<sub id="36yz0"><s id="36yz0"></s></sub>

<sub id="36yz0"><s id="36yz0"></s></sub>