商湯、清華通才AI智能體,100%解鎖我的世界!單CPU訓(xùn)2天,白手起家打造紅石電路
在AI發(fā)展進(jìn)程中有一個非常有趣卻有違常識的現(xiàn)象——
「一些對人類而言相對困難的任務(wù),例如下棋,對AI來說卻相對容易實現(xiàn)。而在開放世界中與環(huán)境交互、進(jìn)行規(guī)劃和決策等對人類來說較簡單的事,AI卻面臨巨大挑戰(zhàn)」
而這,就是莫拉維克悖論。
不過,現(xiàn)在GITM成功打破了這一悖論限制,在復(fù)雜且類似于現(xiàn)實世界的環(huán)境中取得突破,能夠像人類一樣生存,探索和創(chuàng)造了!
在緊密模擬真實世界的暢銷游戲《我的世界》(Minecraft)中,由商湯科技聯(lián)合清華大學(xué)、上海人工智能實驗室等機構(gòu)研究者們共同提出的通才AI智能體 Ghost in the Minecraft(GITM),不但能夠玩轉(zhuǎn)《我的世界》,且比以往所有智能體都有更加優(yōu)秀表現(xiàn)。
項目主頁:https://github.com/OpenGVLab/GITM
像人類一樣生存,探索和創(chuàng)造
此研究在向通用人工智能(AGI)方向邁出了重要一步。
廣泛的任務(wù)覆蓋
GITM在《我的世界》內(nèi)主世界的所有技術(shù)挑戰(zhàn)上實現(xiàn)了100%的任務(wù)覆蓋率(成功解鎖了完整的科技樹的262個物品),而此前所有智能體的總和只能覆蓋30%。(以往所有智能體方法包括OpenAI和DeepMind在內(nèi)總共只解鎖了78個)
高任務(wù)成功率
在最受關(guān)注的「獲取鉆石」任務(wù)上,GITM取得了67.5%的成功率,相比于目前最佳成績(OpenAI VPT)提高了47.5%。
極高的訓(xùn)練效率
GITM的訓(xùn)練效率也達(dá)到新高度。環(huán)境交互步數(shù)只需已有方法的萬分之一,單一CPU節(jié)點訓(xùn)練2天即可完成,遠(yuǎn)遠(yuǎn)低于之前OpenAI VPT所需的6480個GPU天或DeepMind DreamerV3所需的17個GPU天。
通才AI智能體「Ghost in the Minecraft」(GITM)玩轉(zhuǎn)《我的世界》游戲,生存模式白手起家,拿到主世界的所有物品,挖鉆石不在話下,還能制作附魔書!
GITM面對各類地形、環(huán)境、白天黑夜場景,甚至遇到怪物也能自如應(yīng)對
GITM還可以進(jìn)一步應(yīng)用在《我的世界》更加復(fù)雜的任務(wù)中,比如生存所需的避難所、農(nóng)田、鐵傀儡,創(chuàng)造自動化設(shè)備所需的紅石電路、進(jìn)入下界所需的下界傳送門等。
這些任務(wù)展示了GITM強大的能力和可擴(kuò)展性,使得智能體能夠在《我的世界》中長時間生存、發(fā)展,探索更加高級的世界。
通用人工智能突破加速AI產(chǎn)業(yè)化革命
研發(fā)攻克《我的世界》中所有技術(shù)挑戰(zhàn)的AI智能體GITM,目的是構(gòu)建一個具備自主學(xué)習(xí)和掌握整個真實世界技能的通用人工智能方向。
GITM打破了傳統(tǒng)以RL為基礎(chǔ)的架構(gòu),采用大型語言模型(LLM)作為智能體核心的新范式。
這一創(chuàng)新也有助于推動通用人工智能(AGI)的研究目標(biāo)加速實現(xiàn),發(fā)展出能夠在開放世界環(huán)境中像人一樣進(jìn)行感知、理解和交互的智能體,并為機器人和自動駕駛等產(chǎn)業(yè)帶來巨大突破和進(jìn)步,有效解決現(xiàn)實世界中復(fù)雜環(huán)境和各類長尾問題,推動AI技術(shù)更大規(guī)模的產(chǎn)業(yè)落地。
「Ghost in the Minecraft」(GITM)
得益于「大模型+大算力」推進(jìn)AGI(通用人工智能)發(fā)展的戰(zhàn)略布局,以及全棧大模型研發(fā)體系,商湯科技得以在多模態(tài)、多任務(wù)通用大模型領(lǐng)域快速發(fā)展,以「日日新SenseNova」大模型體系為核心,不斷助力創(chuàng)新技術(shù)快速應(yīng)用于智能汽車、智慧生活、智慧商業(yè)和智慧城市等領(lǐng)域,持續(xù)提升產(chǎn)業(yè)智能化。
今天,GITM的成功將推動自動駕駛等應(yīng)用處理復(fù)雜任務(wù)的能力更上一層樓,打破更高的技術(shù)天花板。