自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

MIT、OpenAI等震撼力作:AI首次自主發(fā)現(xiàn)人工生命!人類(lèi)窺見(jiàn)上帝造物

人工智能 新聞
Sakana AI聯(lián)合MIT、OpenAI等機(jī)構(gòu)提出了全新算法,自動(dòng)搜索人工生命再達(dá)新的里程碑!不需要繁瑣手工設(shè)計(jì),只通過(guò)描述,AI就能發(fā)現(xiàn)全新的人造生命體了。

就在剛剛,由Transformer八子創(chuàng)立的Sakana AI,聯(lián)合來(lái)自MIT、OpenAI、瑞士AI實(shí)驗(yàn)室IDSIA等機(jī)構(gòu)的研究人員,提出了「自動(dòng)搜索人工生命」的新算法!

圖片

論文地址:https://arxiv.org/abs/2412.17799

值得一提的是,世界上首個(gè)「AI科學(xué)家」便是由Sakana AI提出的——就是可以獨(dú)立搞科研,完全不需要人類(lèi)插手的那種。不僅如此,它當(dāng)時(shí)還直接一口氣肝出了10篇論文。

言歸正傳,ALife,即「人工生命」,是一門(mén)跨學(xué)科研究,旨在通過(guò)模擬生命的行為、特性和演化過(guò)程來(lái)理解生命的本質(zhì),通常結(jié)合了計(jì)算科學(xué)、生物學(xué)、復(fù)雜系統(tǒng)科學(xué)以及物理學(xué)等領(lǐng)域。

人工生命(ALife)的研究中,蘊(yùn)含著能夠推動(dòng)和加速人工智能進(jìn)步的重要洞見(jiàn)。

如果能用AI加速人工生命的發(fā)現(xiàn),人類(lèi)就會(huì)加深對(duì)涌現(xiàn)現(xiàn)象、進(jìn)化機(jī)制和智能本質(zhì)的理解,而這些核心原則,可以為下一代AI系統(tǒng)提供靈感!

圖片

而這次研究者們提出的算法,可以使用視覺(jué)-語(yǔ)言基礎(chǔ)模型自動(dòng)發(fā)現(xiàn)人工生命。

以往,人工生命模擬的每一個(gè)微小細(xì)節(jié)規(guī)則,往往都需要繁瑣的手工設(shè)計(jì);但現(xiàn)在,只需要描述要搜索的模擬空間,ASAL就可以自動(dòng)發(fā)現(xiàn)最有趣、具有開(kāi)放式的人造生命體了!

由于基礎(chǔ)模型的廣泛通用性,ASAL可以在各種經(jīng)典的人工生命模擬中發(fā)現(xiàn)新的生命形式,包括 Boids、Particle Life、生命游戲(Game of Life)、Lenia和神經(jīng)元胞自動(dòng)機(jī)(Neural Cellular Automata)。

圖片

已發(fā)現(xiàn)的生命形式的例子

甚至,ASAL還發(fā)現(xiàn)了一些全新的元胞自動(dòng)機(jī)規(guī)則,比原始的康威生命游戲更具開(kāi)放式和表現(xiàn)力。

研究者相信,這種全新的范式能夠克服手動(dòng)設(shè)計(jì)模擬的瓶頸,重新激發(fā)人工生命研究的熱情,從而突破人類(lèi)創(chuàng)造力的極限,讓這一領(lǐng)域再上一層樓。

研究一出,網(wǎng)友們就炸翻了。

有人說(shuō),這項(xiàng)驚人的工作,是釋放AI的力量,重新定義人工生命。

圖片

有研究者表示,自己多年以來(lái)一直在嘗試類(lèi)似的事,用隨機(jī)數(shù)學(xué)運(yùn)算符作為基因,來(lái)模擬行為進(jìn)化。但他們的這項(xiàng)研究,是一個(gè)更精彩的版本。

圖片

圖片

自主智能創(chuàng)造人工生命,聽(tīng)起來(lái),我們似乎在扮演上帝的角色。

圖片

更有趣的是,這項(xiàng)研究是否可以用來(lái)觀(guān)察意識(shí)的誕生?

圖片

AI自動(dòng)搜索「可能的生命」

生命是什么?

這個(gè)看似簡(jiǎn)單的問(wèn)題,卻蘊(yùn)含著無(wú)盡的探索空間。

現(xiàn)實(shí)世界中,我們只能去觀(guān)察和研究已知的生命形式。但是,通過(guò)計(jì)算機(jī)模擬,科學(xué)家們正在探索一個(gè)更宏大命題——可能存在的生命。

這也是人工生命(ALife)研究的核心。

通過(guò)計(jì)算機(jī)來(lái)研究生命,便意味著需要搜索、繪制整個(gè)可能的模擬空間,而非是單一的模擬。

它能夠讓研究人員弄清,為什么以及如何通過(guò)不同模擬配置,會(huì)產(chǎn)生不同涌現(xiàn)的行為。

ALife在模擬中進(jìn)化和學(xué)習(xí)機(jī)制豐富多樣,但其基礎(chǔ)性突破一個(gè)主要障礙是缺乏系統(tǒng)性方法來(lái)搜索所有可能的模擬配置。

傳統(tǒng)上,研究人員主要依靠直覺(jué)和經(jīng)驗(yàn),去設(shè)計(jì)猜測(cè)這些「人工虛擬世界」的基本規(guī)則。

另一個(gè)挑戰(zhàn)便是,在復(fù)雜系統(tǒng)中,簡(jiǎn)單部件大規(guī)模相互作用,可能會(huì)產(chǎn)生完全意想不到的涌現(xiàn)結(jié)果。

最最重要的是,這些現(xiàn)象很難,甚至不可能提前預(yù)測(cè)。

這種不可預(yù)測(cè)性使得設(shè)計(jì)出,能自我復(fù)制、生態(tài)系統(tǒng)動(dòng)態(tài)等特性的模擬變得極其困難。

也正因此,當(dāng)前ALife領(lǐng)域的研究往往通過(guò)手動(dòng)設(shè)計(jì)模擬,而且這些模擬也僅針對(duì)簡(jiǎn)單、可預(yù)測(cè)的結(jié)果,從而限制了意外發(fā)現(xiàn)的可能性。

那么,什么才是最好的解決辦法?

Sakana AI、MIT、OpenAI等人認(rèn)為,自動(dòng)化搜索模擬的方法,能夠擴(kuò)大探索范圍,從根本上改變ALife研究方式。

當(dāng)前,也有很多團(tuán)隊(duì)嘗試通過(guò)復(fù)雜生命度量、復(fù)雜性、有趣程度去量化ALife,但這些指標(biāo)幾乎總是無(wú)法完全捕捉人類(lèi)對(duì)這些概念的細(xì)微理解。

ASAL開(kāi)創(chuàng)性框架

對(duì)此,新研究中提出了一個(gè)創(chuàng)新方案:利用基礎(chǔ)模型(FM)來(lái)自動(dòng)化搜索合適的模擬。

基礎(chǔ)模型們基于大量自然界數(shù)據(jù)完成訓(xùn)練,形成了與人類(lèi)形式的表征能力,甚至可能正在趨向于真實(shí)世界統(tǒng)計(jì)特征的「柏拉圖式」表征。

正是這一特性,使得FM成為量化人工生命復(fù)雜性的理想工具。

基于這個(gè)思路,團(tuán)隊(duì)提出了自動(dòng)化人工生命搜索(ASAL)全新框架,如下圖所示。

圖片

研究人員首先定義一組感興趣的模擬,稱(chēng)為「基質(zhì)」(substrate)。

基質(zhì)S包含任何感興趣的人工生命模擬集合(例如所有Lenia模擬的集合)。這些模擬可能在初始狀態(tài)、轉(zhuǎn)換規(guī)則或兩者都有所不同。

S由參數(shù)θ定義,該參數(shù)確定了一個(gè)包含三個(gè)組件的單一模擬:

- 初始狀態(tài)分布Init_θ

- 前向動(dòng)態(tài)階躍函數(shù)Step_θ

- 渲染函數(shù)(將狀態(tài)轉(zhuǎn)換為圖像)Render_θ

這里,需要說(shuō)明的是,渲染函數(shù)的參數(shù)化和搜索并非是必要的,但在處理先驗(yàn)不可解釋的狀態(tài)值時(shí),才是必要的。

將這些項(xiàng)連接在一起,定義一個(gè)函數(shù)θ,它對(duì)初始狀態(tài) S_0 進(jìn)行采樣,運(yùn)行模擬T步,并將最終狀態(tài)渲染為圖像:

圖片

最后,兩個(gè)附加函數(shù)VLM_img(?) 和VLM_txt(?) 通過(guò)視覺(jué)語(yǔ)言FM嵌入圖像和自然語(yǔ)言文本,應(yīng)用相應(yīng)的內(nèi)積運(yùn)算 <?,?>,以便實(shí)現(xiàn)該嵌入空間的相似度測(cè)量。

與此同時(shí),ASAL包含了三個(gè)基于視覺(jué)-語(yǔ)言基礎(chǔ)模型(FM)的算法,它們通過(guò)不同類(lèi)型自動(dòng)化搜索發(fā)現(xiàn)人工生命。具體包括:

圖片

監(jiān)督目標(biāo)搜索

——針對(duì)能夠產(chǎn)生特定目標(biāo)事件或事件序列的模擬進(jìn)行搜索,從而促進(jìn)各種可能世界或與我們自身相似世界的發(fā)現(xiàn)。

在A(yíng)Life研究中,尋找能夠?qū)崿F(xiàn)特定事件或事件序列的模擬是一個(gè)重要目標(biāo)。

這種發(fā)現(xiàn)可以幫助研究人員識(shí)別,與人類(lèi)世界相似的模擬世界,或者測(cè)試某些反事實(shí)的進(jìn)化軌跡在給定基底中是否可能,從而洞察某些生命形式的可行性。

為此,ASAL系統(tǒng)搜索能夠產(chǎn)生與目標(biāo)自然語(yǔ)言提示在基礎(chǔ)模型表示空間中匹配的圖像的模擬。

研究人員可以控制在每個(gè)時(shí)間步是否使用提示,以及使用什么樣的提示。

圖片

開(kāi)放式搜索

——針對(duì)能夠在基礎(chǔ)模型(FM)表示空間中產(chǎn)生時(shí)間上持續(xù)開(kāi)放的新奇性的模擬進(jìn)行搜索,從而發(fā)現(xiàn)對(duì)人類(lèi)觀(guān)察者始終有趣的世界。

ALife研究的一個(gè)重大挑戰(zhàn)是尋找開(kāi)放式模擬。

盡管開(kāi)放性是主觀(guān)的,且難以定義,但在適當(dāng)表示空間中的新穎性可以捕捉到開(kāi)放性的一般概念。

這種方法將測(cè)量開(kāi)放性的主觀(guān)性轉(zhuǎn)移到表示函數(shù)的構(gòu)建上,該函數(shù)體現(xiàn)了觀(guān)察者的視角。

論文中,視覺(jué)-語(yǔ)言基礎(chǔ)模型的表示作為人類(lèi)表示的智能體。

有了這種新的能力,ASAL可以搜索能夠在基礎(chǔ)模型表示空間中產(chǎn)生歷史性新穎圖像的模擬。

一些初步實(shí)驗(yàn)表明,通過(guò)歷史最近鄰來(lái)評(píng)估新穎性,比基于方差的方法效果明顯更好。

圖片

啟迪式搜索(Illumination)

——針對(duì)一組具有趣味性和多樣性的模擬進(jìn)行搜索,從而探索未知的世界

此外,ALife研究的另一個(gè)關(guān)鍵目標(biāo),是自動(dòng)揭示基質(zhì)中可能出現(xiàn)的所有多樣化現(xiàn)象。

這種理念,是源于對(duì)理解「可能存在的生命形式」的追求。這種揭示是繪制和分類(lèi)整個(gè)基底的第一步。

為了實(shí)現(xiàn)這一目標(biāo),ASAL搜索一組模擬,使其產(chǎn)生的圖像在基礎(chǔ)模型的表示空間中,最近鄰距離最大。

研究人員發(fā)現(xiàn),這種基于最近鄰的多樣性比基于方差的多樣性能夠產(chǎn)生更好的揭示效果。

圖片

總的來(lái)說(shuō),ASAL全新方法已經(jīng)在多個(gè)人工生命系統(tǒng)中取得重要突破,包括Boids、粒子生命、生命游戲、Lenia和神經(jīng)元元胞自動(dòng)機(jī)等等。

ASAL發(fā)現(xiàn)了前所未見(jiàn)的生命形式,拓展了人工生命中涌現(xiàn)的結(jié)構(gòu)邊界。

而且,這也是人類(lèi)首次通過(guò)基礎(chǔ)模型驅(qū)動(dòng)ALife模擬發(fā)現(xiàn)的研究。

實(shí)驗(yàn)

研究者通過(guò)多種基質(zhì)的實(shí)驗(yàn)驗(yàn)證了ASAL的有效性,隨后利用基礎(chǔ)模型(FM)對(duì)部分發(fā)現(xiàn)的模擬,進(jìn)行了新穎的定量分析。

基礎(chǔ)模型

- CLIP(對(duì)比語(yǔ)言-圖像預(yù)訓(xùn)練)

這是一種視覺(jué)-語(yǔ)言基礎(chǔ)模型,通過(guò)在大規(guī)?;ヂ?lián)網(wǎng)數(shù)據(jù)集上進(jìn)行對(duì)比預(yù)訓(xùn)練,將圖像和文本的潛在空間對(duì)齊,從而學(xué)習(xí)通用的圖像和文本表示。

CLIP明確提供了 VLM_img(?) 和 VLM_txt(?) 兩種功能。

- DINOv2(無(wú)標(biāo)簽蒸餾)

這是一種僅針對(duì)視覺(jué)的基礎(chǔ)模型,通過(guò)在大型圖像數(shù)據(jù)集上使用自監(jiān)督的師生框架學(xué)習(xí)視覺(jué)表征。

DINOv2僅提供VLM_img(?),因此無(wú)法用于A(yíng)SAL的監(jiān)督目標(biāo)搜索。

基質(zhì)

- Boids

它模擬了N個(gè)「鳥(niǎo)群」(boids)在二維歐幾里得空間中的運(yùn)動(dòng)。

所有boids共享一個(gè)神經(jīng)網(wǎng)絡(luò)的權(quán)重,該神經(jīng)網(wǎng)絡(luò)根據(jù)局部參考框架中K個(gè)鄰近boids的情況,決定每個(gè)boid向左或向右轉(zhuǎn)向。

該基質(zhì)是神經(jīng)網(wǎng)絡(luò)的權(quán)重空間。

圖片

- Particle Life(或Clusters)

它模擬了N個(gè)粒子,每個(gè)粒子屬于K種類(lèi)型之一,在二維歐幾里得空間中相互作用。

該基質(zhì)是K×K交互矩陣和β參數(shù)的空間,用于確定粒子之間的接近程度。初始狀態(tài)是隨機(jī)采樣的,粒子自組織形成動(dòng)態(tài)模式。

圖片

- 類(lèi)生命元胞自動(dòng)機(jī)(CA)

它將康威生命游戲推廣到所有二進(jìn)制狀態(tài)的CA,這些CA在二維晶格中運(yùn)行,其狀態(tài)轉(zhuǎn)換僅取決于活著的摩爾鄰居數(shù)量和單元當(dāng)前狀態(tài)。

該基質(zhì)有2^18=262,144種可能的模擬。

圖片

- Lenia

它將康威生命游戲推廣到連續(xù)的空間和時(shí)間,允許更高的維度、多種核和多通道。

研究者使用LeniaBreeder代碼庫(kù),定義了動(dòng)態(tài)的45維度和初始狀態(tài)的 32×32×3=3072維度。搜索空間以找到的解決方案為中心。

圖片

- 神經(jīng)元胞自動(dòng)機(jī)(NCA)

通過(guò)用神經(jīng)網(wǎng)絡(luò)表示局部轉(zhuǎn)換函數(shù),來(lái)參數(shù)化任何連續(xù)的元胞自動(dòng)機(jī)。該基質(zhì)是神經(jīng)網(wǎng)絡(luò)的權(quán)重空間。

圖片

目標(biāo)模擬的搜索

- 單一目標(biāo)

團(tuán)隊(duì)研究了在Lenia、Boids和Particle Life中,通過(guò)單個(gè)提示詞指定目標(biāo)模擬的搜索效果。

監(jiān)督目標(biāo)方程在經(jīng)過(guò)T個(gè)模擬時(shí)間步后,應(yīng)用一次提示詞進(jìn)行優(yōu)化。其中,CLIP作為基礎(chǔ)模型,優(yōu)化算法使用了Sep-CMA-ES。

下圖顯示,從定性角度看,在找到與指定提示詞匹配的模擬方面,優(yōu)化過(guò)程的表現(xiàn)良好。

一些失敗模式表明,當(dāng)優(yōu)化失敗時(shí),問(wèn)題往往出在基質(zhì)的表達(dá)能力不足,而非優(yōu)化過(guò)程本身。

圖片

通過(guò)監(jiān)督目標(biāo)方程,ASAL發(fā)現(xiàn)了一些模擬,它們的最終狀態(tài)與指定的提示詞相匹配。結(jié)果展示了三種不同基質(zhì)的情況

- 時(shí)間序列目標(biāo)

團(tuán)隊(duì)研究了使用NCA基質(zhì)搜索,生成一系列目標(biāo)事件的模擬的有效性。

通過(guò)一個(gè)提示詞列表,研究者優(yōu)化了監(jiān)督目標(biāo)方程,每個(gè)提示詞在模擬展開(kāi)過(guò)程中按均勻的時(shí)間間隔依次應(yīng)用。

研究者使用CLIP作為基礎(chǔ)模型。按照原始NCA論文的方法,使用了時(shí)間反向傳播和梯度下降算法,并采用Adam優(yōu)化器進(jìn)行優(yōu)化。

下圖展示了ASAL可以找到生成符合提示詞序列軌跡的模擬。

通過(guò)指定期望的進(jìn)化軌跡并結(jié)合約束基質(zhì),ASAL能夠識(shí)別出體現(xiàn)所需進(jìn)化過(guò)程本質(zhì)的更新規(guī)則。

例如,當(dāng)提示詞序列為「一個(gè)細(xì)胞」然后是「兩個(gè)細(xì)胞」時(shí),相應(yīng)的更新規(guī)則會(huì)自然地支持自我復(fù)制的能力。

圖片

通過(guò)監(jiān)督目標(biāo)方程,ASAL發(fā)現(xiàn)了一些模擬,它們生成的事件序列與提示詞列表相匹配。第二行展示了第一個(gè)模擬如何推廣到不同的初始狀態(tài)。結(jié)果展示了NCA基質(zhì)的情況

搜索開(kāi)放式模擬

為了研究搜索開(kāi)放式模擬的有效性,研究者使用了類(lèi)生命元胞自動(dòng)機(jī)(Life-Like CAs)基質(zhì),并優(yōu)化了開(kāi)放式評(píng)分。

CLIP作為基礎(chǔ)模型。由于搜索空間相對(duì)較小,僅包含262,144種模擬,因此采用了窮舉搜索方法。

下圖揭示了類(lèi)生命元胞自動(dòng)機(jī)中開(kāi)放式的潛力。

根據(jù)開(kāi)放式指標(biāo),著名的康威生命游戲(Conway’s Game of Life)在開(kāi)放式評(píng)分中排名前5%。

頂部子圖顯示,最開(kāi)放的元胞自動(dòng)機(jī)表現(xiàn)出位于混沌邊緣的非平凡動(dòng)態(tài)模式,因?yàn)樗鼈兗炔粫?huì)停滯,也不會(huì)爆炸。

左下方子圖描繪了三個(gè)元胞自動(dòng)機(jī)在CLIP空間中的軌跡隨模擬時(shí)間的變化情況。

基礎(chǔ)模型的表示與人類(lèi)的認(rèn)知表示相關(guān),通過(guò)基礎(chǔ)模型表示空間中的軌跡生成新穎性,也會(huì)為人類(lèi)觀(guān)察者帶來(lái)一系列新奇體驗(yàn)。

右下方子圖使用UMAP圖對(duì)所有類(lèi)生命元胞自動(dòng)機(jī)的CLIP嵌入進(jìn)行了可視化,并按開(kāi)放式評(píng)分著色,顯示出有意義的結(jié)構(gòu):最開(kāi)放的元胞自動(dòng)機(jī)集中在模擬主島外的小島上。

圖片

開(kāi)放式模擬的發(fā)現(xiàn)

通過(guò)開(kāi)放式方程,ASAL在類(lèi)生命元胞自動(dòng)機(jī)基質(zhì)中發(fā)現(xiàn)了開(kāi)放式模擬。這些模擬使用Golly表示法標(biāo)記,表示出生和存活所需的活鄰居數(shù)量。

  1. 展示了發(fā)現(xiàn)的元胞自動(dòng)機(jī)在模擬展開(kāi)過(guò)程中的渲染結(jié)果
  2. 描繪了三個(gè)模擬在CLIP空間中的時(shí)間軌跡。像素空間模擬(紅色)表現(xiàn)出收斂軌跡,而基礎(chǔ)模型空間模擬(綠色)表現(xiàn)出更具發(fā)散性的軌跡,甚至超過(guò)了康威生命游戲(藍(lán)色)的軌跡
  3. 所有類(lèi)生命元胞自動(dòng)機(jī)基于其最終狀態(tài)的CLIP嵌入的UMAP投影繪制,并按開(kāi)放式評(píng)分著色。結(jié)果揭示了類(lèi)似模擬的獨(dú)特島嶼結(jié)構(gòu),其中最開(kāi)放的元胞自動(dòng)機(jī)集中在底部附近的小島上

啟迪整片基質(zhì)(Illuminating Entire Substrates)

研究者使用Lenia和Boids基質(zhì),來(lái)研究啟迪式算法的有效性,其中CLIP作為基礎(chǔ)模型。

他們使用一種自定義的遺傳算法執(zhí)行搜索:在每一代中,隨機(jī)選擇父代,生成帶有變異的子代,然后保留解決方案中最具多樣性的子集。

結(jié)果模擬集被展示在下圖的「模擬圖譜」中。這種可視化突出了按視覺(jué)相似性組織的發(fā)現(xiàn)行為的多樣性。

可以看到圖譜以一種有序的方式映射了所有發(fā)現(xiàn)的模擬。其中,左上方的插圖顯示了未使用啟迪式算法進(jìn)行隨機(jī)采樣的結(jié)果。

在Lenia中,ASAL發(fā)現(xiàn)了許多以前未曾見(jiàn)過(guò)的生命形式,這些生命形式類(lèi)似于按顏色和形狀分類(lèi)的細(xì)胞和細(xì)菌。

圖片

在Boids中,ASAL不僅重新發(fā)現(xiàn)了經(jīng)典的群體行為,還探索出了其他行為模式,例如蛇形運(yùn)動(dòng)、聚集、繞圈以及其他變體。

圖片

這些模擬的最終狀態(tài),會(huì)通過(guò)CLIP嵌入并使用UMAP投影到二維空間中。然后對(duì)該空間進(jìn)行網(wǎng)格采樣,并展示每個(gè)網(wǎng)格內(nèi)最近的模擬。

量化人工生命

基礎(chǔ)模型(FM)不僅可以對(duì)有趣現(xiàn)象進(jìn)行搜索,還能夠?qū)χ皟H能進(jìn)行定性分析的現(xiàn)象進(jìn)行定量化分析。

在下圖中,研究人員對(duì)兩個(gè)Boids模擬之間的參數(shù)進(jìn)行線(xiàn)性插值。中間的模擬缺乏任何一個(gè)原始模擬的特性,表現(xiàn)為無(wú)序狀態(tài),這清楚地表明Boids參數(shù)空間具有非線(xiàn)性和混沌特性。

更重要的是,通過(guò)測(cè)量中間模擬最終狀態(tài)與兩個(gè)原始模擬的CLIP相似性,這一定性觀(guān)察現(xiàn)在可以通過(guò)定量數(shù)據(jù)得以支持。

圖片

模擬最終狀態(tài)隨參數(shù)從一個(gè)模擬線(xiàn)性插值到另一個(gè)模擬的變化

下圖評(píng)估了粒子生命(Particle Life)中粒子數(shù)量對(duì)其表現(xiàn)特定生命形式能力的影響。

在這個(gè)案例中,搜索「毛毛蟲(chóng)」,發(fā)現(xiàn)只有當(dāng)模擬中至少有1,000個(gè)粒子時(shí)才能找到毛毛蟲(chóng),這與科學(xué)觀(guān)察中「數(shù)量決定差異」(more is different)的理念一致。

圖片

隨粒子數(shù)量增加,在粒子生命中涌現(xiàn)「毛毛蟲(chóng)」的變化

接下來(lái)的圖表通過(guò)逐一調(diào)整粒子生命模擬的各個(gè)參數(shù),并測(cè)量CLIP提示詞對(duì)齊評(píng)分的標(biāo)準(zhǔn)差,來(lái)量化每個(gè)參數(shù)對(duì)模擬行為的重要性。

在確定最重要的參數(shù)后,發(fā)現(xiàn)其對(duì)應(yīng)于綠色和黃色粒子之間的交互強(qiáng)度,而這種交互對(duì)毛毛蟲(chóng)的形成至關(guān)重要。

圖片

按對(duì)模擬行為的重要性對(duì)粒子生命模擬參數(shù)進(jìn)行排序

下圖展示了Lenia模擬中CLIP向量隨模擬時(shí)間變化的速度。該指標(biāo)在模擬看起來(lái)已經(jīng)定性靜止時(shí)精確達(dá)到平臺(tái)期,為模擬提供了一個(gè)有用的停止條件。

圖片

繪制Lenia中CLIP嵌入隨模擬時(shí)間變化的圖表,量化平臺(tái)信號(hào)

獨(dú)立于基礎(chǔ)模型

為了研究使用適當(dāng)表示空間的重要性,研究人員對(duì)Lenia和Boids的啟迪式過(guò)程所使用的FM進(jìn)行了消融實(shí)驗(yàn)。

在實(shí)驗(yàn)中,他們分別使用了CLIP、DINOv2以及低級(jí)像素表示作為對(duì)比。

如下圖所示,在生成與人類(lèi)認(rèn)知一致的多樣性方面,CLIP的表現(xiàn)似乎略?xún)?yōu)于DINOv2,但兩者在質(zhì)量上都顯著優(yōu)于基于像素的表示。

這一結(jié)果強(qiáng)調(diào)了在衡量人類(lèi)對(duì)多樣性概念的認(rèn)知時(shí),深度基礎(chǔ)模型表示(如CLIP和DINOv2)相比低級(jí)指標(biāo)(如像素表示)的重要性。

圖片

基礎(chǔ)模型的重要性

在啟迪式實(shí)驗(yàn)中,通過(guò)對(duì)基礎(chǔ)模型進(jìn)行了消融分析,結(jié)果顯示,CLIP在創(chuàng)建與人類(lèi)認(rèn)知一致的多樣性方面表現(xiàn)略?xún)?yōu)于DINOv2,但兩者均顯著優(yōu)于基于像素的表示。

責(zé)任編輯:張燕妮 來(lái)源: 新智元
相關(guān)推薦

2024-05-11 13:41:39

AI數(shù)據(jù)

2025-04-24 09:03:00

2024-12-25 12:04:34

2013-12-25 09:39:36

程序員代碼

2024-12-25 15:36:44

Sakana AI大模型ASAL

2022-12-23 15:04:33

Meta模型

2024-04-15 11:48:09

2024-01-02 09:05:58

科學(xué)AI

2023-12-01 14:34:42

AnthropicAILLM

2024-12-05 10:57:24

2024-12-30 09:00:00

o3編程軟件

2021-02-01 10:47:11

人工智能機(jī)器學(xué)習(xí)技術(shù)

2024-11-05 14:48:57

2021-01-07 14:56:55

AI 數(shù)據(jù)人工智能

2019-06-14 16:31:04

阿里AI法官

2025-01-20 09:38:00

OpenAI模型數(shù)據(jù)

2025-01-27 09:51:24

AI模型開(kāi)源

2022-05-09 11:23:43

人工智能機(jī)器學(xué)習(xí)推理

2019-10-31 14:37:55

技術(shù)人工智能開(kāi)發(fā)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)