AI畫中國(guó)退休老太太微博大火!「傻鵝之王」和快樂(lè)小狗挑戰(zhàn)GPT-4想象力極限
AI的創(chuàng)造力到底極限在哪里?
最近網(wǎng)友發(fā)現(xiàn),只要適時(shí)地給GPT-4來(lái)點(diǎn)PUA,就能讓它將自己想象力和創(chuàng)造力的極限給激發(fā)出來(lái)。
前段時(shí)間,「AI冷課長(zhǎng)」用AI畫的不同退休金的中國(guó)老太太,一度登上微博熱搜。
給出的指令從「畫一個(gè)沒(méi)有退休金的中國(guó)老太太」、到「每個(gè)月有1000塊退休金的老太太」,再到「每個(gè)月10萬(wàn)退休金的老太太」等等……
網(wǎng)友紛紛表示,AI是懂養(yǎng)老的!
當(dāng)然,最得人心的還得是最后一幅!
PUA GPT-4畫出「傻鵝之王」,宇宙和時(shí)間旅行是終點(diǎn)
無(wú)獨(dú)有偶,Pipedream Labs的CEO Garrett Scott McCurrach也整了一個(gè)挑戰(zhàn)GPT-4極限的活兒。
他在社交媒體上發(fā)布了一張鵝的圖像,和網(wǎng)友說(shuō),每有10個(gè)人點(diǎn)贊,我就讓這只鵝變得更傻一點(diǎn)。
于是網(wǎng)友稍微一發(fā)力,這張照片就被點(diǎn)贊了好幾萬(wàn)次。
而McCurrach本人,也開始了自己對(duì)GPT-4的PUA。
GPT-4讓鵝進(jìn)一步變傻,眼睛一只大一只小,戴個(gè)傻乎乎的蝴蝶結(jié),有那味了。
看來(lái)在GPT-4眼里,五彩斑斕的顏色似乎和傻的關(guān)聯(lián)度很高。
還有就是,多半因?yàn)槌粤颂唷改⒐健苟鴮?dǎo)致的眼球充血。
看得出來(lái),這幾只傻鵝確實(shí)是智商不太高的樣子。
總的來(lái)說(shuō),張著嘴,伸著舌頭,變大的眼睛,都是越來(lái)越傻的標(biāo)志。
最終GPT-4將傻的定義停留在了「口吐異物」這個(gè)點(diǎn)上。
到這里,似乎GPT-4的想象力到達(dá)了極限。
如果還需要對(duì)「傻」這個(gè)詞進(jìn)行進(jìn)一步的演繹,GPT-4已經(jīng)做不到了,需要人類給與更加明確的提示。
作者接著PUA GPT-4,給了它關(guān)鍵詞「傻鵝之王」之后,GPT-4最終給出了它眼里的有著「帝王之氣」的傻鵝。
同樣的思路,網(wǎng)友又對(duì)狗子下手了,讓GPT-4創(chuàng)造一張高興的狗狗照片。
這次是讓狗狗變高興,看著效果還不錯(cuò)。
狗狗拿上了自己喜歡的球和飛盤,看來(lái)GPT-4是懂狗子的。
而更高興的狗狗眼里,世界都變小了,自己在不斷變大,身體也騰空了起來(lái)。
此時(shí),五彩的背景,微微張開的小嘴又是高興的象征。
迷幻的顏色,不斷變大的身軀成為了GPT-4想象之中越來(lái)越高興的意象。
最后,大到了太空之中,成為了和星系相比肩的狗狗。
不斷被人類PUA的GPT-4終于讓「狗狗快樂(lè)似神仙」。
進(jìn)入宇宙的狗狗,終于融入了平行世界,成為了一只看不見摸不著的「快樂(lè)之狗」。
也讓我們對(duì)GPT-4的創(chuàng)造力和對(duì)快樂(lè)的理解肅然起敬。
在見識(shí)到了GPT-4對(duì)于「傻」和「快樂(lè)」理解的極限之后,網(wǎng)友換了個(gè)口味,想看看GPT-4的想象力之中,「平平無(wú)奇」有沒(méi)有極限。
網(wǎng)友讓GPT-4生成了一張普通的街道照片。
然后是一張普通的客廳照片,一切都是最普通的設(shè)計(jì)。
普通的書桌,除了有兩個(gè)日歷稍顯特別之外,確實(shí)非常普通,連顯示器看上去都是多年前的老款,不能再普通了。
城市最普通的街角,看路牌似乎是紐約一個(gè)普通的十字路口。
一杯非常普通的咖啡,微微冒著一點(diǎn)熱氣,連溫度都是如此的克制。
一個(gè)普通的開關(guān),背景是白色的墻面,唯一的特殊之處是和兩個(gè)螺絲的組合,看上去有點(diǎn)像一個(gè)人臉。
當(dāng)作者要求GPT-4畫一個(gè)極致普通的物品時(shí),GPT-4給出的答案是一個(gè)放在桌子上的筆記本。
沒(méi)有任何的特征,極致的簡(jiǎn)約和普通不過(guò)如此。
當(dāng)作者認(rèn)為還能更普通時(shí),GPT-4有點(diǎn)受不了了,給出了一個(gè)白色房間中的一堵白墻,看來(lái)白色在AI眼里就是最為普通的顏色,方形就是最為普通的形狀。
當(dāng)作者要求再普通一些,GPT-4給出了一張白色的畫布。
這可能是一個(gè)作圖AI眼中最為普通的物品,畢竟它是創(chuàng)作一切內(nèi)容的基礎(chǔ)。
當(dāng)作者要求更進(jìn)一步的普通時(shí),GPT-4給出了自己特殊的回答:
「這是一個(gè)普通程度最高的形象——一個(gè)毫無(wú)特征的虛空,充斥著虛無(wú)感」。
還不夠!一定還能更普通!
于是,GPT-4畫出了一個(gè)比「虛空」更加普通的物體,一個(gè)白色空間中的一個(gè)白色小點(diǎn)。
又小又白看來(lái)就是最為普通的物體。
作者依然不相信,質(zhì)問(wèn)GPT-4還有沒(méi)有更加普通的東西。GPT-4拿出了自己壓箱底的「普通之物」:
一個(gè)巨大的空曠的空間,似乎還能無(wú)限延伸。
最終,在人類無(wú)法想象的空間中,這是最無(wú)聊最普通的一個(gè)形象。
它普通到已經(jīng)無(wú)法存在了。確實(shí),看上去就像一個(gè)普通的「黑洞」,沒(méi)有任何「特點(diǎn)」能夠逃逸出來(lái)。
但其實(shí),如果要一直追問(wèn),GPT-4似乎永遠(yuǎn)不會(huì)停下來(lái),會(huì)不停的輸出它認(rèn)為更加「普通」的圖像。
一直到所有問(wèn)題的終結(jié):GPT-4額度用完。
AI的極限是太空?其實(shí)人類也是
這是互聯(lián)網(wǎng)哲學(xué)家、人工智能研究員Eliezer Yudkowsky對(duì)AI進(jìn)行的「普通測(cè)試」,在不斷地逼迫下,AI往往都會(huì)把最極端的輸出歸結(jié)到太空或者是時(shí)間旅行上。
大概率是因?yàn)楹腿祟惱斫獾臉O限一樣,太空也是AI所知道的這個(gè)世界的極限所在,所以最終對(duì)于AI想象力的PUA,AI都會(huì)以輸出太空中的內(nèi)容作為最終的結(jié)果。
而在追求極限的過(guò)程中,GPT-4往往會(huì)向人類訴苦,說(shuō)自己已經(jīng)到達(dá)極限了。
但是如果人類以更加嚴(yán)厲的口吻進(jìn)一步敦促AI更進(jìn)一步時(shí),甚至和AI爭(zhēng)吵時(shí),AI往往還能再挖掘一些自己的潛力。
這個(gè)過(guò)程甚至讓不少網(wǎng)友看了后覺得人類是不是太過(guò)殘忍了。
但是OpenAI的系統(tǒng)提示會(huì)回答,「情緒和痛苦不是編程的一部分」在逼迫AI的過(guò)程中,似乎不需要考慮太多。
但是Yudkowsky也感嘆到,「對(duì)于人類來(lái)說(shuō),似乎這不是一個(gè)好兆頭,人類似乎沒(méi)有任何辦法確定(AI系統(tǒng)能否感到痛苦)?!?/span>
AI能像人類一樣有創(chuàng)造力嗎?
創(chuàng)造力是推動(dòng)社會(huì)發(fā)展和創(chuàng)新的關(guān)鍵,但要評(píng)估它卻是一項(xiàng)復(fù)雜且往往帶有主觀判斷的任務(wù)。
隨著先進(jìn)的生成式AI模型崛起,越來(lái)越多過(guò)去被認(rèn)為只有人類創(chuàng)造力才能做到的工作,都能被這些模型輕松搞定。
最近,由新加坡國(guó)立大學(xué)、斯坦福大學(xué)、谷歌DeepMind、羅格斯大學(xué)、微軟研究院和哥倫比亞大學(xué)組成的聯(lián)合團(tuán)隊(duì),提出了一個(gè)名為「相對(duì)創(chuàng)造力」(Relative Creativity)的全新概念來(lái)解決定義和評(píng)價(jià)創(chuàng)造力的難題。
除了界定和分析了可度量的創(chuàng)造力,研究人員還提出了一套切實(shí)可行的訓(xùn)練指導(dǎo)原則,有效地連接了創(chuàng)造力的理論量化和模型訓(xùn)練的實(shí)際操作。
最后,研究人員為評(píng)估和促進(jìn)AI模型的統(tǒng)計(jì)創(chuàng)造力,建立了一個(gè)連貫、不斷演進(jìn)和變革性的框架。
論文地址:https://arxiv.org/abs/2401.01623
在這里,研究人員不再試圖給創(chuàng)造力下一個(gè)普遍性的定義,而是轉(zhuǎn)而探討AI是否能夠達(dá)到一個(gè)假想人類的創(chuàng)造能力水平。
這個(gè)新視角受到了圖靈測(cè)試的啟發(fā),該測(cè)試是判斷機(jī)器是否能夠像人類一樣思考的標(biāo)準(zhǔn),并在此基礎(chǔ)上擴(kuò)展,從而應(yīng)對(duì)評(píng)價(jià)創(chuàng)造力時(shí)固有的挑戰(zhàn)和主觀性問(wèn)題。
這種方法論上的轉(zhuǎn)變,使得研究人員可以利用統(tǒng)計(jì)創(chuàng)造力(Statistical Creativity)這一概念,對(duì)AI的創(chuàng)造力進(jìn)行統(tǒng)計(jì)上的量化評(píng)估,進(jìn)而直接比較AI和人類在創(chuàng)造力上的差異。
在此基礎(chǔ)上,研究人員還進(jìn)一步探討了如何將統(tǒng)計(jì)創(chuàng)造力應(yīng)用到具有提示技巧(prompting paradigm)的現(xiàn)代自回歸模型中。
相對(duì)創(chuàng)造力(a)和統(tǒng)計(jì)創(chuàng)造力(b)
論文作者一手Q&A
問(wèn)題 1:這篇論文主要關(guān)注什么內(nèi)容?
回答:論文主要構(gòu)建了一個(gè)具體的框架,旨在探索人工智能(AI)的創(chuàng)造力。它提出了相對(duì)創(chuàng)造力(Relative Creativity)和統(tǒng)計(jì)創(chuàng)造力(Statistical Creativity)這兩個(gè)概念,目的是判定AI是否能夠達(dá)到人類的創(chuàng)造性水平。論文強(qiáng)調(diào)的是對(duì)AI創(chuàng)造力的比較性評(píng)價(jià),而不是給創(chuàng)造力下一個(gè)絕對(duì)的定義。
問(wèn)題 2:什么是相對(duì)創(chuàng)造力?
回答:相對(duì)創(chuàng)造力是評(píng)價(jià)AI創(chuàng)造力的一個(gè)新概念,它通過(guò)將AI產(chǎn)出的作品與一個(gè)假想但符合現(xiàn)實(shí)的人類創(chuàng)作者在相同背景影響下所創(chuàng)作的作品進(jìn)行比較。如果AI模型能創(chuàng)作出與人類創(chuàng)作者的作品無(wú)法區(qū)分的作品,那么這個(gè)模型就可以被認(rèn)為具有相對(duì)創(chuàng)造力,這一評(píng)定是由評(píng)估者來(lái)決定的。
問(wèn)題 3:為什么AI創(chuàng)造力的主觀性很重要,論文是如何討論這個(gè)問(wèn)題的?
回答:創(chuàng)造力的主觀性至關(guān)重要,因?yàn)椴煌奈幕?、學(xué)科和個(gè)體對(duì)創(chuàng)造性的定義可能截然不同。論文通過(guò)在評(píng)估AI創(chuàng)造力時(shí)引入相對(duì)視角來(lái)處理這個(gè)問(wèn)題,即把AI的創(chuàng)意產(chǎn)出與特別挑選的人類參照物進(jìn)行對(duì)比。在選擇這個(gè)參照的人類時(shí),就融入了多元的創(chuàng)造性觀點(diǎn)和標(biāo)準(zhǔn)。這種方法使得對(duì)AI創(chuàng)造力的研究能夠保持一定的客觀性。
問(wèn)題 4:這種對(duì)創(chuàng)造力的理解與計(jì)算機(jī)科學(xué)和認(rèn)知科學(xué)的早期研究有何不同,它又是如何體現(xiàn)圖靈測(cè)試的理念呢?
回答:與計(jì)算機(jī)科學(xué)和認(rèn)知科學(xué)中的傳統(tǒng)方法不同,這種理解創(chuàng)造力的方法采取了相對(duì)評(píng)估而非絕對(duì)定義。就像圖靈測(cè)試通過(guò)比較機(jī)器行為與人類反應(yīng)來(lái)評(píng)估智能,而不是堅(jiān)持一個(gè)固定的定義一樣,相對(duì)創(chuàng)造力通過(guò)將AI的創(chuàng)作與一個(gè)假想的人類創(chuàng)作者的作品進(jìn)行比較來(lái)評(píng)估AI。這種比較方法有效地避免了建立一個(gè)通用創(chuàng)造力定義的復(fù)雜性,轉(zhuǎn)而集中于更實(shí)際的目標(biāo):判斷AI是否能在類似的情境下復(fù)現(xiàn)人類的創(chuàng)造才能。
問(wèn)題 5:統(tǒng)計(jì)創(chuàng)造力如何幫助評(píng)估相對(duì)創(chuàng)造力?
回答:統(tǒng)計(jì)創(chuàng)造力是一種評(píng)估方法,它讓我們能夠?qū)嶋H和現(xiàn)實(shí)地評(píng)估相對(duì)創(chuàng)造力。這種方法通過(guò)比較AI根據(jù)提示所做的創(chuàng)作與真實(shí)人類創(chuàng)作者的作品,并采用一種分布距離的度量方式來(lái)判斷AI模型是否能夠模仿特定人群的創(chuàng)造才能。
問(wèn)題 6:如何反映和量化AI創(chuàng)造力的不同層次?
回答:AI的不同創(chuàng)造力層次可以通過(guò)選擇具有不同創(chuàng)造水平的人類群體(目標(biāo)分布)來(lái)展現(xiàn)。例如,比較AI與兒童的創(chuàng)造力和將AI與博士研究員的創(chuàng)造力作為對(duì)照,會(huì)得到不同的評(píng)估結(jié)果。AI的創(chuàng)造力可以表現(xiàn)為簡(jiǎn)單模仿(如復(fù)制已有的數(shù)據(jù)分布),也可以是模仿日常人類的行為,甚至實(shí)現(xiàn)高創(chuàng)造力個(gè)體的復(fù)刻。這一理論為我們提供了一個(gè)控和實(shí)現(xiàn)這些不同創(chuàng)造力層次的框架,通過(guò)選擇合適的人類創(chuàng)造力分布來(lái)實(shí)現(xiàn)。
問(wèn)題 7:統(tǒng)計(jì)創(chuàng)造力損失(Statistical Creative Loss)是什么,它如何促進(jìn)對(duì)AI創(chuàng)造力的研究?
回答:統(tǒng)計(jì)創(chuàng)造力損失是一種新提出的損失函數(shù),它基于理論原則來(lái)指導(dǎo)實(shí)際的AI模型訓(xùn)練,以培養(yǎng)具有創(chuàng)造性的AI。這個(gè)概念幫助我們理解如何優(yōu)化訓(xùn)練目標(biāo)和選擇合適的創(chuàng)造者與作品的匹配,目的是根據(jù)統(tǒng)計(jì)創(chuàng)造力(Statistical Creativity)的理念,增強(qiáng)AI模型的創(chuàng)造性能力。