OpenAI的人工智能進(jìn)軍DOTA2:影魔solo輕松擊敗頂級選手Dendi和Sumail!(附賽況視頻&現(xiàn)場采訪)
AI 科技評論按:在攻克了圍棋以后,人工智能研究者們似乎不約而同地把電子競技游戲作為了下一個練兵場。這兩天 DeepMind 剛剛聯(lián)合暴雪發(fā)布了一系列星際2的開發(fā)工具包,便于自己和全球的研究者們開發(fā)玩星際2的AI,OpenAI 更是已經(jīng)取得了一些成果,借著DOTA2國際邀請賽 TI7 的機(jī)會,在西雅圖鑰匙館正賽現(xiàn)場邀請了職業(yè)選手 Dendi 與自己的人工智能一決高下。
賽況慘烈!
Dendi 是世界知名DOTA2職業(yè)選手、solo高手,不僅自己的玩法靈動多變,經(jīng)常出現(xiàn)神級的操作,還曾帶領(lǐng) Navi 戰(zhàn)隊(duì)拿下 TI1冠軍和TI2、TI3亞軍。
然而這一切在 OpenAI 的 AI 面前都顯得無力。三局兩勝的比賽,在影魔中路對solo、不允許使用瓶子和魂戒、死兩次或者丟一塔為負(fù)的規(guī)則下,第一局 Dendi 在線上沒有占到什么便宜,然后不小心被拿了一血,回到線上以后找機(jī)會和 AI 在兵線上近身對拼,結(jié)果同歸于盡,死亡達(dá)到兩次輸?shù)舻谝痪帧?/p>
OpenAI 的 CTO Greg Brockman 和開發(fā)工程師 Jakub Pachocki 就在 Dendi 身后觀戰(zhàn),輸?shù)舻谝痪忠院篑R上與 Dendi 握手致意,然后在進(jìn)入第二局之前,三個人一同接受了主持人的短暫采訪。
第二局則結(jié)束得更快,由于 Dendi 沒有擋好小兵,一露頭就一直被 AI 壓制,接著2級時被 AI 進(jìn)塔強(qiáng)殺,直接打出GG認(rèn)輸。(完整視頻見文末)
秘訣:自我學(xué)習(xí),兩周出師
主持人在兩局比賽之間和結(jié)束后采訪了 Dendi、Greg Brockman 和 Jakub Pachocki 三人。這個 AI 的10人開發(fā)團(tuán)隊(duì)也來到了現(xiàn)場觀戰(zhàn)。
開發(fā)工程師 Jakub Pachocki 簡單介紹了 AI 的訓(xùn)練過程:“這個AI跟以往的游戲AI不一樣,它完全是通過自己跟自己對局學(xué)習(xí)的。我們沒有給它設(shè)計任何策略、沒有從人類高手的對局中學(xué)習(xí),從一開始就是自己和自己對局。雖然玩出來的結(jié)果基本是隨機(jī)的,但是每次都能提高那么一點(diǎn)點(diǎn),慢慢慢慢就達(dá)到了專業(yè)級水平。”
這個過程中的表現(xiàn)挺有意思的,根據(jù) Jakub介紹,“它剛開始會在地圖上亂跑,不知道怎么回事就死在塔下了,那么很快學(xué)會了這樣不行以后,就待在家里不出來。接下來會站在地圖里一動不動只是看著,然后會攻擊一下小兵、推進(jìn)一下兵線之類的,甚至有時候還能補(bǔ)到兵。”“訓(xùn)練過程中其實(shí)沒有突然的大突破,就是一點(diǎn)點(diǎn)、一點(diǎn)點(diǎn)地升級?;镜膶W(xué)會以后就也逐漸學(xué)會騙對手的操作了。”
OpenAI CTO Greg Brockman的講解更加令人驚訝:“這個AI從零開始,連續(xù)訓(xùn)練了2個星期的時間。訓(xùn)練了一個小時以后就已經(jīng)可以打過內(nèi)置的AI了,2周以后就達(dá)到了今天我們看到的水平。”“我們構(gòu)建的是一個通用學(xué)習(xí)系統(tǒng),在很多方面仍然受到限制,但是它已經(jīng)能夠打敗最強(qiáng)的人類DOTA玩家了。在構(gòu)建更加通用的系統(tǒng)的過程中,這就是重要的一步,以后它們能夠?qū)W會真實(shí)世界中復(fù)雜、混亂的重要任務(wù),比如外科手術(shù)。我們OpenAI的目標(biāo)就是確保這樣強(qiáng)大的系統(tǒng)能夠?yàn)槿祟愖龀鲐暙I(xiàn)。”
而且他還表示:“我們計劃的下一步是5v5的比賽,明年的TI上就可以讓大家看到!”這話說完以后現(xiàn)場觀眾一片歡呼。
主持人讓 Dendi 評價 AI 的表現(xiàn),他的評價是:“你的任何操作失誤都會被AI抓住,毫不猶豫,很厲害!”比賽開始前,看到上臺的對手是一臺電腦的時候 Dendi 還是一臉詫異的“你在逗我”的表情,在賽后已經(jīng)變成了不甘心:“從來沒有想過會被AI打敗。”“感覺它有點(diǎn)像人類,也有點(diǎn)不像。”
游戲表現(xiàn):神乎其技
如果你覺得 Dendi 輸給 AI 是因?yàn)樗挠澳娴目赡軟]有屠夫那么好的話,更多職業(yè)選手也在早些時候“體驗(yàn)”了這個 AI,而且全都“意外”地輸了;EG 戰(zhàn)隊(duì)的 Arteezy 表示自己從 replay 中有所收獲,Sumail 直接輸了個0:10。
具體到操作上,人類玩家需要有意識做出的卡兵、壓制、拉仇恨、運(yùn)補(bǔ)給等等動作在 AI 身上一應(yīng)俱全,第一局里 Dendi 驚呼 AI 的影魔身上有個芒果,第二局里 AI 的這個卡兵則直接讓全場沸騰了。
下面的假動作和站在兵線上吃藥秀走位也顯示出了頂級的水平(上方為AI)。
達(dá)成這樣的表現(xiàn)可一點(diǎn)也不容易。AlphaGo 的比賽中大家都見識到了圍棋的復(fù)雜多變,但每一步只要在某個位置落子就好;DOTA比賽中的操作則要復(fù)雜得多,在基于血量、藍(lán)量、裝備、消耗品、buff等方面判斷自己的狀態(tài)以后,如何移動、面向的方向、技能釋放地點(diǎn)、真動作還是假動作都需要考量。OpenAI 也放出了下面這個視頻逐項(xiàng)講解了 AI 學(xué)到的操作技能。
下一步: TI8的5v5?
在搞定了影魔 solo 比賽以后,OpenAI 的下一步打算是讓 AI 玩起 5v5 的比賽,并在明年的 TI8 上和職業(yè)戰(zhàn)隊(duì)過招。不過也已經(jīng)有DOTA2玩家在欽佩 solo AI 之后表達(dá)了對 5v5 AI 的擔(dān)心,畢竟在 solo 的基礎(chǔ)之上,多人團(tuán)隊(duì)比賽中還有 BAN/PICK、分路、接技能、吸引火力、大后期、買活、強(qiáng)拆等等策略性極強(qiáng)、對團(tuán)隊(duì)配合要求極高的因素。每屆 TI 中都有職業(yè)玩家做出精彩的配合令觀者拍案叫絕,AI 能否具有這樣的創(chuàng)造力(“靈性”)也讓人捏了把汗。
不過,該來的總是要來的,職業(yè)選手們已經(jīng)表示希望經(jīng)常和 solo 中這樣厲害的 AI 過招了。雷鋒網(wǎng)(公眾號:雷鋒網(wǎng)) AI 科技評論也會密切關(guān)注 OpenAI 的 DOTA2 AI 動向,祝 Open AI 好運(yùn)、為中國 DOTA 加油。
Dendi 與 AI 影魔 solo 完整視頻如下: