DeepMind運用AI技術(shù)為國際象棋制定新規(guī)則

作者：佚名 2020-09-16 19:11:22

在國際象棋與人工智能這對奇妙的組合中，谷歌DeepMind的研究人員又找到新的探索道路

這一次，他們與前國際象棋世界冠軍弗拉基米爾·克拉姆尼克(Vladimir Kramnik)合作，希望引導(dǎo)AI技術(shù)重新學(xué)習(xí)這種古老棋類游戲的最新變體。

為了改善已經(jīng)極為平衡的象棋規(guī)則體系，研究團隊開始對這種已經(jīng)擁有千年歷史的棋盤游戲做出調(diào)整，并借助AI從中找到最合理、最具趣味性的變化組合。

科學(xué)家們使用AlphaZero(一種自適應(yīng)學(xué)習(xí)系統(tǒng)，能夠從零開始自學(xué)新規(guī)則并達到超越人類的游戲水平)，對團隊在克拉姆尼克幫助下預(yù)先定義的九種國際象棋規(guī)則變體進行測試。

對于每一種變體，AlphaZero都會自我對弈數(shù)萬盤，分析特定棋盤條件下的所有可能棋步，并整理出新的戰(zhàn)略與游戲方式。以此為基礎(chǔ)，克拉姆尼克與研究人員們進一步評估如果采用這些變體，人類選手之間的對抗將呈現(xiàn)出怎樣的狀態(tài)，最終判斷不同的規(guī)則集能否切實改善對弈。

過去幾個世紀以來，國際象棋得到了長足發(fā)展，新的變體形式不斷涌現(xiàn)。這些變體或是為了改善這項古老運動的認知門檻、或是為了在比賽中引入新的復(fù)雜性。對規(guī)則的調(diào)整無疑會對游戲策略、可玩性乃至盤面動態(tài)產(chǎn)生巨大沖擊，而且從歷史角度來看，以往只有觀察過足夠多人類棋手的真實對弈過程及結(jié)果，才能深刻理解規(guī)則變化帶來的實際影響。

DeepMind的研究人員們表示，“以這些規(guī)則變化為基礎(chǔ)訓(xùn)練AlphaZero模型，使我們得以在數(shù)小時時間內(nèi)快速模擬出以往需要數(shù)十年才能實現(xiàn)的人類對弈過程，并回答一個個「假設(shè)」問題：在相應(yīng)戰(zhàn)略戰(zhàn)術(shù)發(fā)展成熟之后，各種國際象棋變體究竟擁有怎樣的發(fā)展?jié)撃?”

AlphaZero測試的規(guī)則發(fā)動包括：選手可以吃掉自己的棋子，或者允許將兵卒向后移動兩步等。研究團隊還提出了“禁王車易位”規(guī)則，這相當于極大降低了對弈雙方戰(zhàn)成平局的可能性。

AI系統(tǒng)以每秒一步的速度在各種變體上分別完成了10000局對弈，而后再以每分鐘一步的速度再完成1000局對弈。為了盡可能客觀地研究規(guī)則變化對于游戲質(zhì)量的影響，科學(xué)家們還研究了多項其他因素。其中之一就是觀察平局這一最令棋手們感到沮喪的狀況的發(fā)生幾率。

總體而言，大多數(shù)變體確實增加了國際象棋的可能性，“僵局=勝利”這一新規(guī)則也讓對弈中的考量因素進一步增加。研究人員們還發(fā)現(xiàn)，時間控制也會給游戲帶來決定性的影響：每秒一步的對弈，下成平局的可能性將遠遠低于每分鐘一步。

每秒一步的對弈，下成平局的可能性將遠遠低于每分鐘一步

結(jié)果還顯示，在大部分對弈當中，AlphaZero都能夠借助新規(guī)則積極采用前所未有的戰(zhàn)術(shù)，而不再拘泥于經(jīng)典棋路。研究人員們指出，“這表明新的規(guī)則確實產(chǎn)生了影響，也令游戲本身變得更具生命力。”

在對AlphaZero在新規(guī)則下的行為進行統(tǒng)計分析之后，DeepMind團隊還參考了克拉姆尼克的意見，包括由其解答規(guī)則變體下棋子出現(xiàn)的位置、移動方式以及其他關(guān)于戰(zhàn)術(shù)思路的主觀問題。而這位前國際象棋世界冠軍的參與與評論，也有望讓這些全新規(guī)則在傳統(tǒng)國際象棋社區(qū)中得到關(guān)注。

這位俄羅斯國際象棋大師長久以來一直在倡導(dǎo)取消“王車易位”規(guī)則的變體，并表示取消這項規(guī)則為了鼓勵進攻，消除棋盤雙方消極抵抗的動機。另一方面，克拉姆尼克還發(fā)現(xiàn)“僵局=勝利”變體對于國際象棋的總體影響較小。

國際象棋網(wǎng)站Chess.com首席國際象棋棋手Danny Rensch也通過視頻點評了DeepMind的發(fā)現(xiàn)。但與克拉姆尼克不同，Rensch認為“僵局=勝利”這項規(guī)則最有可能顯著改變國際象棋的標準游戲方式。

Rensch解釋道，“除非真正消除造成僵局的因素，否則國際象棋永遠不可能徹底擺脫這個難題。我堅信僵局應(yīng)該等于勝利，這不僅有助于初學(xué)者們探索關(guān)于這門運動的更多可能，同時也將給棋盤上的搏殺方式產(chǎn)生決定性的影響。”

最終，AlphaZero給出的觀點只能作為參考，我們無法預(yù)測哪些國際象棋規(guī)則變體能夠真正為人們所接受。找到答案的唯一方法，就是觀察人類選手如何采用、更改或放棄不同的變體。但無論如何，如果這次嘗試能夠讓更多朋友重新打開塵封已久的棋盤，就是DeepMind研究團隊最大的勝利。

責(zé)任編輯：姜華來源：科技行者

自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepMind運用AI技術(shù)為國際象棋制定新規(guī)則