用游戲測試人工智能,盤點(diǎn)三大開源3D測試環(huán)境
《我的世界》對于José Hernández-Orallo而言并不陌生,他是一名計算機(jī)科學(xué)家,正在使用這款游戲進(jìn)行自己的研究。他在瓦倫西亞理工大學(xué)的研究團(tuán)隊(duì)設(shè)計了一種測試機(jī)器智能性能的基準(zhǔn),這種方法的設(shè)計靈感來源于他看到自己的孩子在3D虛擬世界中游戲的情形。在《我的世界》中,玩家通常需要通過互動解決問題,而不是射殺怪物。
《我的世界》是一款風(fēng)靡全球的游戲,現(xiàn)在科研人員們正在使用它來測試人工智能
2014年,微軟購買了《我的世界》的所有權(quán),這家科技巨頭的研究機(jī)構(gòu)——微軟研究院隨后在此之上設(shè)計了一個用于科研的新版本,讓計算機(jī)程序和科學(xué)家們可以探索和自定義游戲中的3D環(huán)境。隨后,微軟邀請了包括Hernández-Orallo在內(nèi)的一些外部研究人員下載了這個機(jī)器友好版本的《我的世界》。從2015年7月起,微軟將其完全開放,現(xiàn)在任何人都可以免費(fèi)使用它,微軟希望以此加快人工智能領(lǐng)域的研究速度。
人工智能在各種游戲中的研究最近變得非?;鸨?,很多公司正像微軟一樣在游戲中投入研究力量。12月3日,DeepMind開放了自己的3D虛擬世界程序DeepMind Lab,供所有開發(fā)人員下載和自定義使用。這家谷歌下屬公司設(shè)計的虛擬環(huán)境一開始被用于訓(xùn)練自己的人工智能程序。僅僅兩天以后,OpenAI發(fā)布了一個「元平臺」允許人工智能程序在其中與最初為人類玩家設(shè)計的十幾款3D游戲互動,另外,這個環(huán)境還包含了一些網(wǎng)絡(luò)瀏覽器與手機(jī)app。
這三個工具讓研究人員與軟件開發(fā)者們可以輕松地開展自己的實(shí)驗(yàn),測試程序在遇到前所未見的問題時如何進(jìn)行解決,同時可以幫助程序在類似真實(shí)場景的環(huán)境中進(jìn)行自我訓(xùn)練?!高@樣的虛擬環(huán)境將會為人工智能的發(fā)展奠定基礎(chǔ),」西雅圖華盛頓大學(xué)的機(jī)器學(xué)習(xí)研究者Pedro Domingos說道。
DeepMind Lab,一開始被用于訓(xùn)練谷歌自己的人工智能程序,現(xiàn)在已經(jīng)向所有開發(fā)者開放
Atari算法
人工智能是各種視頻游戲的老玩家,但在早期,每個用于通關(guān)的算法都是特殊定制的。近年來,人們的研究重點(diǎn)開始轉(zhuǎn)向于使用機(jī)器學(xué)習(xí)讓程序自我積累經(jīng)驗(yàn)。在2015年上半年,DeepMind推出的算法在Atari游戲中擁有了超越人類玩家的水平,算法通過不斷試錯來獲得游戲高分,設(shè)計者并沒有告訴程序每個游戲的目標(biāo)是什么。
Atari游戲僅僅是2D世界而已。像《我的世界》這樣的「***人稱」3D 視頻游戲可以讓玩家置身于一個充滿立體感的環(huán)境中,相比前者更接近于真實(shí)世界,因此吸引了更多研究者的目光。
在《我的世界》中,玩家可以和虛擬世界中的磚塊互動,使用它們蓋房子,同時也可以探索路線,和游戲世界中的其他內(nèi)容展開交互。面向開發(fā)者的版本被稱為Malmo,允許機(jī)器算法像人類玩家一樣在游戲中進(jìn)行探索。Hernández-Orallo 正在使用Malmo 來探究虛擬環(huán)境是否可用于創(chuàng)建機(jī)器智能的基準(zhǔn)。不同算法可以相互競爭,看看哪一個可以將磚塊搭建成某個物體的形狀,或者比較它們在同一個迷宮中尋路所需的時間,這種測試的涵蓋面相比圖靈測試——機(jī)器智能最有名的測試方式——要廣泛的多。
讓《我的世界》吸引人工智能學(xué)者們的另一個原因是,在游戲中玩家們可以打字互相交流?!高@可以幫助專家們研究人工智能在現(xiàn)實(shí)世界中與人類互動的情況,」微軟研究院的科學(xué)家Katja Hofmann 說道,她在英國劍橋領(lǐng)導(dǎo)著開發(fā)Malmo 的團(tuán)隊(duì)。
目前約有100個研究機(jī)構(gòu)正在使用Malmo 3D 世界,它由微軟研究院開發(fā),用于人工智能研究
訓(xùn)練機(jī)器人
「虛擬世界的人工智能訓(xùn)練對于機(jī)器人的發(fā)展大有益處,」Hofmann 說道。「因?yàn)樘摂M環(huán)境的定制成本很低,定制速度和安全性也有保障。虛擬環(huán)境也可以讓機(jī)器人研究者們專注于解決機(jī)器人的智能問題——機(jī)械的問題有時的確令人分心?!?/p>
除了Hernández-Orallo 以外,微軟研究院還與不少其他研究機(jī)構(gòu)合作開展了一系列Malmo 項(xiàng)目。Hofmann 認(rèn)為真實(shí)的用戶數(shù)量不止于此,也許有100家。
Malmo 平臺包括Java 版本的模塊,以及幫助智能體在 Minecraft 環(huán)境中感知和操作的代碼。這兩個組件可以在 Windows,Linux 或 Mac OS 上運(yùn)行。
DeepMind Lab 和 Malmo 類似,也允許研究者創(chuàng)建迷宮,讓不同算法學(xué)習(xí)如何尋路,獲得獎勵。DeepMind 正在嘗試將「更自然的元素」(如起伏的地形和植物)整加入到這個虛擬世界中。目前這個3D 環(huán)境已經(jīng)開源,DeepMind 希望在其他研究者的幫助下,這個平臺能夠更加復(fù)雜,從而訓(xùn)練更聰明的訓(xùn)練算法。「通過開源,我們可以讓所有人參與進(jìn)來,不斷改進(jìn)這個項(xiàng)目,」DeepMind 的一位發(fā)言人說道。
OpenAI 的元平臺,Universe,相比前兩個3D 世界則更進(jìn)一步。通過為同一個人工智能程序提供多種不同類型的環(huán)境,這一平臺或許可以解決領(lǐng)域內(nèi)最棘手的問題:如何創(chuàng)建一個可以解決任何新問題的算法。目前的深度神經(jīng)網(wǎng)絡(luò)——通過模仿腦細(xì)胞和視覺皮質(zhì)層的結(jié)構(gòu)創(chuàng)建的計算機(jī)系統(tǒng)——可以快速學(xué)會在3D 迷宮中尋路,但同樣一個系統(tǒng)卻無法將自己學(xué)會的方法用于在其他迷宮中導(dǎo)航。「你僅僅改變一下迷宮的顏色,系統(tǒng)就會迷失其中了,」Hernández-Orallo 說道?!高@就是目前***進(jìn)的技術(shù),令人哭笑不得?!?/p>
看來,人工智能的發(fā)展還有很長的路要走。目前微軟現(xiàn)在正努力讓 Malmo 可以在 Universe 中使用?!笓碛幸粋€社區(qū)平臺將使所有人從中受益,」OpenAI 的共同創(chuàng)始人,***技術(shù)官 Greg Brockman 說道。