自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

DeepMind官方確認(rèn)Master身份:全面回顧AlphaGo的再度出山之旅

企業(yè)動(dòng)態(tài)
AlphaGo 的關(guān)鍵在于使用的深度神經(jīng)網(wǎng)絡(luò),而且 DeepMind 在 AlphaGo 中使用了兩種不同的神經(jīng)網(wǎng)絡(luò):第一種叫做策略網(wǎng)絡(luò)(policy network),用來預(yù)測(cè)下一步;第二種叫做價(jià)值網(wǎng)絡(luò)(value network),用來預(yù)測(cè)棋盤上不同的分布會(huì)帶來什么不同的結(jié)果。

[[180856]] 

我就是 AlphaGo!2017 年 1 月 4 日晚 9 時(shí),Master 的神秘面紗終于被揭開了。在對(duì)局周睿羊 9 段的第 59 局比賽之后,名為 Master 的賬號(hào)在騰訊野狐圍棋平臺(tái)上主動(dòng)透露了自己的身份:「我是 AlphaGo 的黃博士(黃士杰)?!闺S后,在對(duì)陣古力 9 段的***一局結(jié)束后,這場(chǎng)由中日韓三國多名旗手對(duì)陣人工智能歷時(shí) 7 天的跨年大戰(zhàn)宣告結(jié)束。

很快,Demis Hassabis 在自己的 Twitter 上發(fā)表了一份聲明:

樊麾在微博上分享了這份聲明并給出了中文版本:

 

網(wǎng)名 Master 的神秘棋手于 12 月 29 日出現(xiàn)在弈城網(wǎng)上圍棋平臺(tái)(最初名為 Magist)。三天時(shí)間對(duì)局?jǐn)?shù)量達(dá)到 30 盤,全部勝利,對(duì)手包括樸廷桓、陳耀燁、羋昱廷、唐韋星等當(dāng)今世界***棋手,其中對(duì)樸廷桓 4 比 0,對(duì)陳耀燁為 2 比 0。

隨著 Master 的連勝,網(wǎng)絡(luò)圍棋平臺(tái)瞬間受到了大量關(guān)注,不少人開始猜測(cè) Master 的真實(shí)身份。有人詢問了 AlphaGo 開發(fā)者黃士杰博士,得到了不置可否的回答。

隨后,Master 在 2016 年 12 月 31 日宣布將休息一天。著名棋手柯潔在微博上表示:「我從三月份開始到現(xiàn)在研究了大半年的棋軟,無數(shù)次的理論、實(shí)踐,就是想知道計(jì)算機(jī)究竟強(qiáng)在哪里。昨晚輾轉(zhuǎn)反側(cè),不想竟一夜無眠。人類數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化,計(jì)算機(jī)卻告訴我們?nèi)祟惾际清e(cuò)的。我覺得,甚至沒有一個(gè)人沾到圍棋真理的邊。但是我想說,從現(xiàn)在開始,我們棋手將會(huì)結(jié)合計(jì)算機(jī),邁進(jìn)全新的領(lǐng)域達(dá)到全新的境界。新的風(fēng)暴即將來襲,我將盡我所有的智慧***一戰(zhàn)!」

在 1 月 1 日晚 11 時(shí),Master 轉(zhuǎn)戰(zhàn)騰訊野狐圍棋,與各路高手展開了新的對(duì)局。因?yàn)槊曺o起,從李欽誠到古力、柯潔、黨毅飛、江維杰、辜梓豪、樸永訓(xùn)、柁嘉熹、姜東潤、井山裕太等人紛紛申請(qǐng)與之對(duì)戰(zhàn),但隨后紛紛負(fù)于這一仍未公開姓名的神秘對(duì)手。

到了 1 月 4 日下午,在網(wǎng)絡(luò)圍棋中與 Master 對(duì)戰(zhàn)過的著名棋手包括柯潔、樸廷桓(韓國冠軍)、井山裕太(日本冠軍)、周俊勛(臺(tái)灣省***人)等人。1 月 4 日下午 3 點(diǎn),中國「棋圣」聶衛(wèi)平在與 Master 的對(duì)戰(zhàn)中失利,這是 Master 的第 54 場(chǎng)勝利。

與柯潔的對(duì)戰(zhàn)

1 月 3 日 Master 戰(zhàn)勝柯潔后,聶衛(wèi)平表示:「Master 改變了我們傳統(tǒng)的厚薄理念,顛覆了多年的定式,圍棋遠(yuǎn)不像我們想象的那么簡(jiǎn)單,還有巨大的空間等著我們?nèi)祟惾ネ诰?,AlphaGo 也好,Master 也罷,都是『圍棋上帝』派來給人類引路的。而在第二天負(fù)于 Master 后,聶衛(wèi)平表示:

Master 技術(shù)全面,從不犯錯(cuò),是其***優(yōu)勢(shì),人類要打敗它的話,必須在前半盤領(lǐng)先,然后中盤和官子也不出錯(cuò),這樣固然很難,但客觀上也促進(jìn)了人類在圍棋技術(shù)上的提高。這盤棋我布局不錯(cuò),但中盤時(shí)打了一個(gè)大勺子,斷送好局,有些可惜。

1 月 4 日晚,在連續(xù)對(duì)陣申真谞 9 段、周睿羊 9 段、古力 9 段后,AlphaGo 的連勝紀(jì)錄擴(kuò)大到了 60 場(chǎng),按照事先的計(jì)劃,谷歌圍棋程序的非正式比賽測(cè)試暫時(shí)告一段落。

Master 在快棋賽中多次盤中獲勝(沒到收官階段對(duì)手就認(rèn)輸了,這說明 Master 的優(yōu)勢(shì)很大),展示了人類棋手無法企及的快棋水平。網(wǎng)絡(luò)快棋是目前職業(yè)選手練習(xí)的主要方式之一,因?yàn)槊恳徊剿伎紩r(shí)間很短,和帶獎(jiǎng)金的正式比賽相比,快棋賽中對(duì)決雙方更加容易出錯(cuò),所以這次「升級(jí)版」AlphaGo 的實(shí)際圍棋水平如何還需要正式規(guī)則比賽的進(jìn)一步檢驗(yàn)。

值得一提的是,去年 12 月 13 日,多名谷歌高層曾經(jīng)突訪中國,他們?cè)谥袊逶号c聶衛(wèi)平、柯潔等人進(jìn)行了交流,并達(dá)成了合作協(xié)議。隨后在日本棋院 Journalist Club 的頒獎(jiǎng)儀式上,Hassabis 曾表示:「2017 年對(duì) AlphaGo 和圍棋界都將是充滿興奮的一年?!谷藗儧]有意識(shí)到,在新的一年還未到來時(shí),人工智能對(duì)于這項(xiàng)流傳千年的古老技藝的沖擊已經(jīng)開始。

[[180857]]

AlphaGo 的系統(tǒng)

AlphaGo 從高調(diào)宣戰(zhàn)開始到 3 月底戰(zhàn)勝李世乭,短短 2 個(gè)多月內(nèi)已經(jīng)博取了無數(shù)的眼球。如今再次出現(xiàn)了一個(gè) Master,它是人?是 AI?還是二者的結(jié)合?業(yè)內(nèi)猜疑不斷。

外行看熱鬧,內(nèi)行看門道。在下棋這件事上我們可能看的是熱鬧(小編著實(shí)不懂棋的套路),但下圍棋的人工智能系統(tǒng)我們?cè)私膺^。

在一月份的 Nature 封面報(bào)道中,曾詳細(xì)地介紹了 AlphaGo 系統(tǒng)當(dāng)時(shí)所采用的技術(shù):

首先 DeepMind 使用了如今火熱的深度學(xué)習(xí)技術(shù),同時(shí)還加上了另一種模擬技術(shù)來對(duì)潛在的步法進(jìn)行建模。深度學(xué)習(xí)需要對(duì)一個(gè)大型的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,使其對(duì)數(shù)據(jù)中的模式做出反應(yīng)。

AlphaGo 的關(guān)鍵在于使用的深度神經(jīng)網(wǎng)絡(luò),而且 DeepMind 在 AlphaGo 中使用了兩種不同的神經(jīng)網(wǎng)絡(luò):***種叫做策略網(wǎng)絡(luò)(policy network),用來預(yù)測(cè)下一步;第二種叫做價(jià)值網(wǎng)絡(luò)(value network),用來預(yù)測(cè)棋盤上不同的分布會(huì)帶來什么不同的結(jié)果。

AlphaGo 使用這兩種網(wǎng)絡(luò)的方法是把非常復(fù)雜的搜索樹減少到可操作的規(guī)模。所以,它并不是在每一步都要考慮幾百種步數(shù),而只考慮政策網(wǎng)絡(luò)提供的幾十種最有前景的步法,價(jià)值網(wǎng)絡(luò)的作用是減少搜索的深度,所以,它的搜索深度并不是特別深,它并不是一下子搜索出直達(dá)比賽末尾的 300 多步,而是搜索更少的步數(shù),比如 20 多步,并評(píng)估這些位置,而不是一路評(píng)估到底,看誰最終能贏。搜索并不是靠蠻力,而是與某種與想象力很相似的東西。

DeepMind 官方發(fā)布的 2016 年度總結(jié)中寫道,「最激動(dòng)人心的莫過于 AlphaGo 博弈過程中所呈現(xiàn)出來的創(chuàng)造力,有時(shí),它的棋招甚至挑戰(zhàn)了古老的圍棋智慧。圍棋,這一古往今來最富深謀遠(yuǎn)慮的游戲之一,AlphaGO 可以識(shí)別并分享其中洞見?!?/p>

就像首位和 AlphaGo 對(duì)戰(zhàn)的專業(yè)選手樊麾在接受機(jī)器之心采訪時(shí)表示:「AlphaGo 可能開辟出另外一種圍棋的美,是我們想象不到的?!?/p>

如果觀看了 AlphaGo 和李世乭的對(duì)弈,你或許不會(huì)對(duì)坐在李世乭對(duì)面的這位感到陌生。他就是 AlphaGo 的核心作者之一 Aja Huang(黃士杰),而這次代「Master」執(zhí)子的也是黃士杰博士。值得注意的是,黃士杰還是 DeepMind 中唯一一位圍棋高手(業(yè)余圍棋 6 段),從他的碩博論文《計(jì)算機(jī)圍棋打劫的策略》和《應(yīng)用于計(jì)算機(jī)圍棋之蒙地卡羅樹搜尋法的新啟發(fā)式算法》便可以看出他對(duì)圍棋的熱愛。

2011 年畢業(yè)于臺(tái)灣師范大學(xué)計(jì)算機(jī)信息工程專業(yè)博士班的黃世杰在 2012 年便加入了 DeepMind 團(tuán)隊(duì),也是該團(tuán)隊(duì)的早期核心成員之一。

在校期間,黃士杰的導(dǎo)師是曾研發(fā) Crazy Stone 的 Rémi Coulom,而 Crazy Stone 正式在 AlphaGo 橫空出世前最有名的圍棋軟件之一。

黃士杰的導(dǎo)師此前在接受媒體報(bào)道時(shí)曾透露,黃士杰讀碩士時(shí)就鎖定圍棋為他的研究課題,為了寫程序,黃士杰有時(shí)在實(shí)驗(yàn)室一呆就是 16 小時(shí),并將他開發(fā)的圍棋程序以其老婆的英文名「Erica」命名。

下面是黃士杰的論文引用情況。憑借發(fā)表于 Nature 的論文《Mastering the game of Go with deep neural networks and tree search》和另一篇論文《Move Evaluation in Go Using Deep Convolutional Neural Networks》的高引用量,黃士杰僅憑 4 篇論文就在短短兩年時(shí)間內(nèi)獲得大約 388 到 851 之間的引用。

【本文為51CTO專欄“機(jī)器之心”原創(chuàng)稿件,轉(zhuǎn)載請(qǐng)通過微信公眾號(hào)(ID:almosthuman2014)獲取授權(quán)】

戳這里,看該作者更多好文

責(zé)任編輯:武曉燕 來源: 機(jī)器之心
相關(guān)推薦

2017-01-13 08:37:57

PythonAlphaGoMuGo

2021-01-07 13:08:27

AI 數(shù)據(jù)人工智能

2017-01-05 09:09:10

2023-12-26 10:59:12

2022-09-20 11:23:51

黑客GTA 6游戲

2016-06-14 03:59:00

WWDC蘋果開發(fā)者大會(huì)

2017-09-04 15:08:37

Linux系統(tǒng)Linux 1.0

2015-12-28 17:10:55

PuppetKubernetes容器

2021-06-01 08:45:06

智慧城市物聯(lián)網(wǎng)5G

2009-04-10 08:56:06

RIM黑莓移動(dòng)OS

2021-10-15 09:00:00

工具PrometheusBlackbox

2016-04-12 20:43:54

AlphaGo+投資機(jī)器人因果樹

2009-11-20 08:48:15

Chrome上市時(shí)間

2024-12-02 12:24:15

2009-05-12 09:50:16

微軟Windows 7操作系統(tǒng)

2023-08-27 22:42:20

2017-03-27 16:35:23

2025-02-14 10:56:58

2013-11-13 13:38:58

點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)