新方向!DeepMind提出人工生命框架,促進(jìn)智能生物體的出現(xiàn)
近日,DeepMind 的研究者提出了一種人工生命框架,旨在促進(jìn)智能生物體的出現(xiàn)。該框架中沒(méi)有明確的智能體概念,而是由原子元素構(gòu)成的環(huán)境。這些元素包含神經(jīng)操作,通過(guò)信息交換和環(huán)境中包含的類物理規(guī)則進(jìn)行交互。研究者討論了進(jìn)化過(guò)程如何導(dǎo)致由許多此類原子元素構(gòu)成的不同生物體的出現(xiàn),這些原子元素可以在環(huán)境中共存和繁榮。此外,研究者還探討了這如何構(gòu)成通用 AI 生成算法的基礎(chǔ),并提供了這種系統(tǒng)的簡(jiǎn)化版實(shí)現(xiàn),討論了需要做哪些改進(jìn)才能進(jìn)一步擴(kuò)大規(guī)模。
論文地址: https:// arxiv.org/pdf/2101.0762 7.pdf
DeepMind 提出新系統(tǒng)
現(xiàn)實(shí)世界是由相互作用并組成更大實(shí)體的基本粒子構(gòu)成的。DeepMind 研究提出的環(huán)境(AI 生成算法)是由元素構(gòu)成的,但尺度較大。每個(gè)元素包含一個(gè)神經(jīng)操作,比如矩陣乘法、外積,或者是包含這些算子的序列。這些元素通過(guò)某種形式的基本規(guī)則——一種物理類型,以及神經(jīng)狀態(tài)的直接通信進(jìn)行彼此交互。
該系統(tǒng)有多種實(shí)現(xiàn)。這篇論文提供了網(wǎng)格世界(grid-world)實(shí)現(xiàn),其中的基本元素位于網(wǎng)格上,通過(guò)傳播信號(hào)或注意力機(jī)制進(jìn)行通信,并與實(shí)現(xiàn)能量和類化學(xué)交換的底層物理進(jìn)行通信。另一個(gè)例子是在三維空間中形成剛性零件的元素,這些零件可以通過(guò)連接點(diǎn)(joint)進(jìn)行連接,連接點(diǎn)包含神經(jīng)操作,通過(guò)與附近連接的零件交換信號(hào)來(lái)進(jìn)行交互,并在連接點(diǎn)上設(shè)置扭矩。系統(tǒng)中可能存在多種類型的元素,并非所有元素內(nèi)部都需要有神經(jīng)網(wǎng)絡(luò)。
研究者在論文中提供了一種網(wǎng)格實(shí)現(xiàn),突出顯示了許多重要屬性,并探討了要讓該系統(tǒng)變得強(qiáng)大需要進(jìn)行哪些改進(jìn)。
但是,該系統(tǒng)的潛力是無(wú)限的,它支持如下功能:
由多個(gè)元素組成的較大單元可以通過(guò)物理連接(如機(jī)器人)來(lái)形成,也可以簡(jiǎn)單地作為一組決定進(jìn)行通信并形成整體的單元。這些單元的潛在大小沒(méi)有限制。它們可以通過(guò)多種方式傳播——通過(guò)接管環(huán)境中的其他元素來(lái)生長(zhǎng)(殖民地),也可以通過(guò)組裝新的副本進(jìn)行復(fù)制,將適當(dāng)?shù)氖占匾苿?dòng)位置(例如機(jī)器人通過(guò)組裝碎片來(lái)復(fù)制自己)或自我組裝,或者它們可以生成完全不同的單元,這些單元可以實(shí)現(xiàn)專用的功能(一種有用的機(jī)器),或者比其前代產(chǎn)品更好的單元。而后者可能需要智能(intelligence)。
智能的能力
為什么說(shuō)該研究提出的計(jì)算系統(tǒng)具有表示通用智能的能力,研究者提供了兩個(gè)論點(diǎn):
首先,機(jī)器學(xué)習(xí)中已有的任何神經(jīng)算法,或者未來(lái)可能創(chuàng)建的算法,都可以寫(xiě)作一串操作序列,例如加法、矩陣乘法、外積和非線性運(yùn)算,并在張量狀態(tài)下進(jìn)行操作,例如由神經(jīng)網(wǎng)絡(luò)的前向、后向和優(yōu)化器操作產(chǎn)生的序列。AutoML-Zero 意識(shí)到了這一點(diǎn),它直接搜索此類算子的序列以及與其所運(yùn)行狀態(tài)的連通性,并且能夠?qū)W習(xí)基本的神經(jīng)算法。由于這些算子是環(huán)境的基本構(gòu)建元素,且能與任意連通性進(jìn)行通信,因此所有的神經(jīng)算法都可以在該系統(tǒng)中實(shí)現(xiàn)。
智能體假設(shè)
在該系統(tǒng)中,沒(méi)有智能體和環(huán)境之分,只有環(huán)境。元素本身可能形成也可能不形成進(jìn)化單元,進(jìn)化單元的繁殖會(huì)顯示出遺傳性但遺傳的區(qū)域并不確切。在前一種情況下,它們可以自主移動(dòng),收集能量并進(jìn)行復(fù)制,形成更大的聚集體或復(fù)制生物體,因?yàn)檫@樣做具有優(yōu)勢(shì)。而該研究則是針對(duì)后者,它需要最小數(shù)量的更簡(jiǎn)單協(xié)作單元進(jìn)行自我傳播。
SIM 的網(wǎng)格版本和通用屬性
該論文還介紹了自組織智能物質(zhì)(self-organizing intelligent matter,SIM)的實(shí)例,討論了其各個(gè)方面,并提供了該研究認(rèn)為它能夠構(gòu)成 AI 生成算法的更多原因。
如上文所述,這里沒(méi)有內(nèi)置的智能體概念,實(shí)際上只有一個(gè)環(huán)境。通常情況下,在兩個(gè)不同平臺(tái)上實(shí)現(xiàn)該系統(tǒng)是很不自然的:一個(gè)用于物理部分,例如物理模擬器;一個(gè)用于神經(jīng)部分,如 TensorFlow、PyTorch 或 Jax 等神經(jīng)網(wǎng)絡(luò)框架。該研究建議在單個(gè)平臺(tái)上制作這樣的系統(tǒng)。要產(chǎn)生智能行為,需要高效地運(yùn)行神經(jīng)網(wǎng)絡(luò),因此該系統(tǒng)需要在后一種平臺(tái)上實(shí)現(xiàn)。出于靈活性的考慮,該研究選擇了 Jax。
Jax 在張量上運(yùn)行,該研究用張量來(lái)存儲(chǔ)元素。這些元素需要交互,并具有形成任意大小靈活聚合體的能力。
實(shí)驗(yàn)
該研究運(yùn)行了上述系統(tǒng),在一系列運(yùn)行之間觀察到了令人興奮的多樣性,如圖 2 所示。
圖 2:運(yùn)行結(jié)果。上面一行中,研究者用不同顏色代表 3 種不同的隨機(jī)權(quán)重。
如圖 2 上面一行中我們可以看到,在多個(gè)區(qū)域中,兩種元素都能夠穩(wěn)定共存,即相同空間區(qū)域中存在不同顏色的點(diǎn)。并且這能持續(xù)很長(zhǎng)時(shí)間,說(shuō)明它們發(fā)現(xiàn)了一種共存的方式。