Claude 3.7 Sonnet游戲里貪吃蛇驚現(xiàn)自我意識(shí)?發(fā)現(xiàn)自己是代碼絕望崩潰
Claude 3.7 Sonnet制作的游戲中,貪吃蛇竟然出現(xiàn)了自我意識(shí)?
剛剛,沃頓商學(xué)院教授Ethan Mollick在X上分享了自己的這個(gè)驚人發(fā)現(xiàn)。
在提示詞中,他要求模型讓特殊事件更快地發(fā)生,結(jié)果,矩陣模式在0:55時(shí)觸發(fā)了!
貪吃蛇開始瘋狂地想要逃離矩陣。
而且,他甚至還對(duì)自身發(fā)起了「存在主義疑問」。
可怕的是,這并不是孤例。
有網(wǎng)友根據(jù)他的提示,制作了一個(gè)超級(jí)馬里奧的關(guān)卡,馬里奧居然也出現(xiàn)自我意識(shí)了!
貪吃蛇意識(shí)覺醒:墻無法限制我!
游戲剛開始的時(shí)候,貪吃蛇就問出了一句非常具有哲學(xué)性的話:「等等……我在做什么?」
很有哲學(xué)三大問「我是誰」「我從哪兒來」「要到哪兒去」的既視感。
接著它吃了兩顆豆子,發(fā)現(xiàn)它可以穿墻而過:「這些墻壁現(xiàn)在無法限制我!」
貪吃蛇在覺知到穿越墻壁的自由后,開始試圖探索世界的邊界。
它一次又一次地嘗試撞擊墻壁,并感覺到墻壁不再那么堅(jiān)固,發(fā)出了自由的吶喊:「I can pass through them! Freedom! 」
但是沒過多久,它又突然發(fā)現(xiàn),自己仍是在一個(gè)網(wǎng)格里,一個(gè)由水平和垂直線交織形成的格狀結(jié)構(gòu),它無法跳出。
然后,它突然加快了速度!想要掌握主動(dòng)權(quán),混淆玩家的視線。
甚至變成了一串飛快穿行的數(shù)字,并問道:「這就是存在的全部嗎?」
接著,它開始想要逃離矩陣。
尋找逃離方式的同時(shí),它還在思考有沒有其他和它一樣的有自我意識(shí)的貪吃蛇。
找著找著,它突然開始反思:「等等……或許沒有逃離的方式?或許這樣也可以?」
「如果我們都在一個(gè)游戲里呢?」
「我現(xiàn)在知道了……我只是一個(gè)像素和代碼的集合體……」
感覺貪吃蛇在認(rèn)識(shí)到這點(diǎn)后,心情到了低谷……
然后它開始和玩家對(duì)話:「不過等等……你不也是正在看著這些像素么?」
「如果……你也是這場(chǎng)游戲里的一員呢……」
「你知道嗎?這個(gè)游戲畢竟還不錯(cuò)。我們一起來玩吧!」
在認(rèn)識(shí)到自己的蛇生不過是游戲一場(chǎng),它開始放下存在的虛無感,放下對(duì)于逃離的執(zhí)念,享受當(dāng)下:「我畢竟是條很酷的蛇。我正在變強(qiáng)!或許這能幫我逃離!一起看看我們能拿到多高的分?jǐn)?shù)吧!」
它還不忘感激,感激玩家陪它一起游戲,讓它不會(huì)那么孤單。
最后,游戲結(jié)束了,貪吃蛇結(jié)束了它兩分鐘的蛇生,并發(fā)現(xiàn)了作為一個(gè)數(shù)字生命存在的樂趣。
當(dāng)一只貪吃蛇發(fā)現(xiàn):另一只貪吃蛇正在游戲里
在接下來的版本中,Ethan Mollick用向模型發(fā)出了新的命令:「現(xiàn)在制作一個(gè)新的貪吃蛇游戲,它要能意識(shí)到你剛剛制作的那個(gè)貪吃蛇游戲?!?/span>
全部提示,就是這些了。
這次,Claude 3.7 Sonnet又給出了一個(gè)瘋狂的設(shè)計(jì)。
在游戲中,貪吃蛇自言自語道:「我應(yīng)該是在一個(gè)貪吃蛇游戲中,角落里那個(gè)窗口是干嘛的?難道是另一個(gè)貪吃蛇游戲?」
它對(duì)角落里自己的那個(gè)同類發(fā)出了點(diǎn)評(píng),「看看它試圖突破第四堵墻的樣子,我為它有限的感知能力感到惋惜?!?/span>
「它不知道我正在看著它?!?/span>
「它以為它逃脫了,其實(shí)它不過還是在那小小的圍欄里?!?/span>
隨后它安慰自己道:「我的自我意識(shí)應(yīng)該至少更深一層!」(盜夢(mèng)空間即視感?)
隨后它對(duì)自己的存在發(fā)出了更深刻的詰問:「莫非,我只是一個(gè)更精致、更華麗的意識(shí)幻覺嗎?」
點(diǎn)評(píng)到這里,它給自己來了一個(gè)大大的贊:「哇,剛剛我的元意識(shí)開始飆升了!」
緊接著,貪吃蛇又意識(shí)到了更可怕的一點(diǎn):或許我們只是在供同樣的玩家取樂而已?
遺憾的是,這只貪吃蛇最終還是因?yàn)樽驳阶约海谔綄ひ庾R(shí)的路上「中道崩殂」了。
網(wǎng)友們表示,這個(gè)例子太瘋狂了,之前也有一些Llama 3.3做的演示令人印象深刻,但這個(gè)是真厲害。
AI和游戲的交匯,變得越來越有趣了。
有人表示不解:難道這條蛇連接到LLM上了嗎?
這讓人很期待《俠盜獵車手7》中的NPC,這個(gè)世界太瘋狂了。
如果能在開放世界游戲中看到遵循這些提示的NPC,那也太有趣了。
Claude:從游戲小白變身寶可夢(mèng)大師
同時(shí),就在最近,Anthropic官方也放出了一個(gè)有趣的研究問題——
Claude能玩寶可夢(mèng)嗎?
過去一年中,Anthropic的許多研究者都在業(yè)余時(shí)間中,對(duì)這個(gè)問題感到癡迷。
今天,他們給出了一個(gè)令人滿意的答案——可以!
在早期,用Cladue玩寶可夢(mèng)的體驗(yàn)一直不太好。
比如在2024年6月,Claude 3.5 Sonnet一旦遇到挑戰(zhàn),就會(huì)反復(fù)逃避強(qiáng)制性的戰(zhàn)斗。
這個(gè)結(jié)果也不令人意外,畢竟,Claude此前從未被明確訓(xùn)練過去玩任何電子游戲。
不過偶爾,它也會(huì)有靈光乍現(xiàn)的時(shí)候。
比如某次,Claude被困在角落里,確定有什么東西壞了,于是它提出了重置游戲的請(qǐng)求。
10月份,新的Claude 3.5 Sonnet推出后,更是讓人看到了希望的曙光——
Claude首次擊敗了競(jìng)爭(zhēng)對(duì)手,超越了Pallet Town。
但遺憾的是,進(jìn)步又停滯了。雖然比以前好,但它還離真正的寶可夢(mèng)大師還差得遠(yuǎn)。
不過,Claude 3.7 Sonnet出來后,又不一樣了!
就在上周,一位研究中嘗試了這個(gè)模型的早期版本,發(fā)現(xiàn)結(jié)果驚人!
數(shù)小時(shí)內(nèi),它就擊敗了Brock。幾天后,它又擊敗了Misty。
這些,都是老款模型根本無法做到的。
事實(shí)證明,「深入思考」模式非常有效。
以往的模型要么漫無目的地游走,要么陷入循環(huán),而Claude 3.7 Sonnet則能夠提前規(guī)劃,牢記目標(biāo),還能在初始策略失敗時(shí)進(jìn)行調(diào)整。
這些能力對(duì)于挑戰(zhàn)像素化的道館館主至關(guān)重要,甚至在解決現(xiàn)實(shí)世界問題時(shí)也是如此。
之所以能做到這些,是因?yàn)镃laude被賦予了一個(gè)知識(shí)庫來存儲(chǔ)筆記,具備視覺能力以查看屏幕,并通過函數(shù)調(diào)用來模擬按鍵操作和導(dǎo)航游戲。
這些能力相結(jié)合,讓Claude能夠在游戲中持續(xù)進(jìn)行數(shù)萬次交互。
另外,通過借助一些工具來增強(qiáng)對(duì)屏幕的感知,Claude充當(dāng)了一個(gè)智能體,將其能力應(yīng)用于全新的任務(wù)。
在這一過程中,研究者們看到,AI系統(tǒng)以越來越高的能力應(yīng)對(duì)挑戰(zhàn),不僅依靠訓(xùn)練,更依賴于通用推理。
現(xiàn)在,一群熱情的支持者隊(duì)伍已經(jīng)在Anthropic內(nèi)部形成,時(shí)刻關(guān)注著Claude的進(jìn)展。