阿里開源Gym StarCraft 能幫助開發(fā)者體驗強化學習
星際爭霸一直是游戲玩家心目中即時戰(zhàn)略類的經(jīng)典之作,歷時十多年而不衰。而如今它更成為深度強化學習、人工智能算法研究的一個主要平臺和工具。因為其蘊含了多智能體協(xié)作、多任務學習、宏觀策略規(guī)劃等復雜問題,一旦取得部分突破和進展,對商業(yè)和社會發(fā)展都會帶來極大影響。如國外的DeepMind、Facebook等公司相繼投入大量人力基于它進行通用人工智能的研究。
在星際爭霸的AI研究中,一直以來缺乏完善的工具鏈和開發(fā)環(huán)境。今年年初Facebook公司發(fā)布的TorchCraft打通了星際和Torch之間的橋梁,但卻不支持主流的Python開發(fā)語言和TensorFlow深度學習框架;早前OpenAI公司發(fā)布的Gym算法平臺雖然支持眾多游戲環(huán)境下的算法驗證和對比測試,但卻缺少對星際的支持。
阿里巴巴作為國內(nèi)領先的大數(shù)據(jù)、云計算公司,對以強化學習為代表的人工智能技術(shù)密切關(guān)注并投入巨大。針對星際AI的這一現(xiàn)狀,率先開發(fā)了一套專業(yè)易用的研究平臺Gym StarCraft,并且已經(jīng)開源:https://github.com/deepcraft/gym-starcraft。
在Gym StarCraft中,AI和強化學習研究者可以非常方便地使用Python語言來進行深度強化學習智能Agent的開發(fā),它底層完成了對TorchCraft和OpenAI Gym的封裝,支持基于TensorFlow和Keras等主流算法框架進行開發(fā),僅需幾十行代碼即可完成一個基本的智能Agent的開發(fā)。同時,便于評測智能Agent的有效性,Gym StarCraft被集成在了OpenAI Gym這一主流的強化學習AI評測平臺中,支持世界各地的星際AI研究者基于它去進行公平、快捷的效果評估,為廣大開發(fā)者提供了一個人工智能的開放協(xié)作研究平臺。對于強化學習的普及和推廣起著關(guān)鍵性作用。