自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<tr id="dsprj"><strike id="dsprj"></strike></tr>

<sub id="dsprj"></sub>

<cite id="dsprj"><rp id="dsprj"></rp></cite>

<legend id="dsprj"><track id="dsprj"><ul id="dsprj"></ul></track></legend>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

DeepMind官方確認(rèn)Master身份：全面回顧AlphaGo的再度出山之旅

作者：機(jī)器之心 2017-01-06 12:08:59

企業(yè)動(dòng)態(tài)

AlphaGo 的關(guān)鍵在于使用的深度神經(jīng)網(wǎng)絡(luò)，而且 DeepMind 在 AlphaGo 中使用了兩種不同的神經(jīng)網(wǎng)絡(luò)：第一種叫做策略網(wǎng)絡(luò)(policy network)，用來預(yù)測(cè)下一步;第二種叫做價(jià)值網(wǎng)絡(luò)(value network)，用來預(yù)測(cè)棋盤上不同的分布會(huì)帶來什么不同的結(jié)果。

我就是 AlphaGo!2017 年 1 月 4 日晚 9 時(shí)，Master 的神秘面紗終于被揭開了。在對(duì)局周睿羊 9 段的第 59 局比賽之后，名為 Master 的賬號(hào)在騰訊野狐圍棋平臺(tái)上主動(dòng)透露了自己的身份：「我是 AlphaGo 的黃博士(黃士杰)?！闺S后，在對(duì)陣古力 9 段的***一局結(jié)束后，這場(chǎng)由中日韓三國多名旗手對(duì)陣人工智能歷時(shí) 7 天的跨年大戰(zhàn)宣告結(jié)束。

很快，Demis Hassabis 在自己的 Twitter 上發(fā)表了一份聲明：

樊麾在微博上分享了這份聲明并給出了中文版本：

網(wǎng)名 Master 的神秘棋手于 12 月 29 日出現(xiàn)在弈城網(wǎng)上圍棋平臺(tái)(最初名為 Magist)。三天時(shí)間對(duì)局?jǐn)?shù)量達(dá)到 30 盤，全部勝利，對(duì)手包括樸廷桓、陳耀燁、羋昱廷、唐韋星等當(dāng)今世界***棋手，其中對(duì)樸廷桓 4 比 0，對(duì)陳耀燁為 2 比 0。

隨著 Master 的連勝，網(wǎng)絡(luò)圍棋平臺(tái)瞬間受到了大量關(guān)注，不少人開始猜測(cè) Master 的真實(shí)身份。有人詢問了 AlphaGo 開發(fā)者黃士杰博士，得到了不置可否的回答。

隨后，Master 在 2016 年 12 月 31 日宣布將休息一天。著名棋手柯潔在微博上表示：「我從三月份開始到現(xiàn)在研究了大半年的棋軟，無數(shù)次的理論、實(shí)踐，就是想知道計(jì)算機(jī)究竟強(qiáng)在哪里。昨晚輾轉(zhuǎn)反側(cè)，不想竟一夜無眠。人類數(shù)千年的實(shí)戰(zhàn)演練進(jìn)化，計(jì)算機(jī)卻告訴我們?nèi)祟惾际清e(cuò)的。我覺得，甚至沒有一個(gè)人沾到圍棋真理的邊。但是我想說，從現(xiàn)在開始，我們棋手將會(huì)結(jié)合計(jì)算機(jī)，邁進(jìn)全新的領(lǐng)域達(dá)到全新的境界。新的風(fēng)暴即將來襲，我將盡我所有的智慧***一戰(zhàn)!」

在 1 月 1 日晚 11 時(shí)，Master 轉(zhuǎn)戰(zhàn)騰訊野狐圍棋，與各路高手展開了新的對(duì)局。因?yàn)槊曺o起，從李欽誠到古力、柯潔、黨毅飛、江維杰、辜梓豪、樸永訓(xùn)、柁嘉熹、姜東潤、井山裕太等人紛紛申請(qǐng)與之對(duì)戰(zhàn)，但隨后紛紛負(fù)于這一仍未公開姓名的神秘對(duì)手。

到了 1 月 4 日下午，在網(wǎng)絡(luò)圍棋中與 Master 對(duì)戰(zhàn)過的著名棋手包括柯潔、樸廷桓(韓國冠軍)、井山裕太(日本冠軍)、周俊勛(臺(tái)灣省***人)等人。1 月 4 日下午 3 點(diǎn)，中國「棋圣」聶衛(wèi)平在與 Master 的對(duì)戰(zhàn)中失利，這是 Master 的第 54 場(chǎng)勝利。

與柯潔的對(duì)戰(zhàn)

1 月 3 日 Master 戰(zhàn)勝柯潔后，聶衛(wèi)平表示：「Master 改變了我們傳統(tǒng)的厚薄理念，顛覆了多年的定式，圍棋遠(yuǎn)不像我們想象的那么簡(jiǎn)單，還有巨大的空間等著我們?nèi)祟惾ネ诰?，AlphaGo 也好，Master 也罷，都是『圍棋上帝』派來給人類引路的。而在第二天負(fù)于 Master 后，聶衛(wèi)平表示：

Master 技術(shù)全面，從不犯錯(cuò)，是其***優(yōu)勢(shì)，人類要打敗它的話，必須在前半盤領(lǐng)先，然后中盤和官子也不出錯(cuò)，這樣固然很難，但客觀上也促進(jìn)了人類在圍棋技術(shù)上的提高。這盤棋我布局不錯(cuò)，但中盤時(shí)打了一個(gè)大勺子，斷送好局，有些可惜。

1 月 4 日晚，在連續(xù)對(duì)陣申真谞 9 段、周睿羊 9 段、古力 9 段后，AlphaGo 的連勝紀(jì)錄擴(kuò)大到了 60 場(chǎng)，按照事先的計(jì)劃，谷歌圍棋程序的非正式比賽測(cè)試暫時(shí)告一段落。

Master 在快棋賽中多次盤中獲勝(沒到收官階段對(duì)手就認(rèn)輸了，這說明 Master 的優(yōu)勢(shì)很大)，展示了人類棋手無法企及的快棋水平。網(wǎng)絡(luò)快棋是目前職業(yè)選手練習(xí)的主要方式之一，因?yàn)槊恳徊剿伎紩r(shí)間很短，和帶獎(jiǎng)金的正式比賽相比，快棋賽中對(duì)決雙方更加容易出錯(cuò)，所以這次「升級(jí)版」AlphaGo 的實(shí)際圍棋水平如何還需要正式規(guī)則比賽的進(jìn)一步檢驗(yàn)。

值得一提的是，去年 12 月 13 日，多名谷歌高層曾經(jīng)突訪中國，他們?cè)谥袊逶号c聶衛(wèi)平、柯潔等人進(jìn)行了交流，并達(dá)成了合作協(xié)議。隨后在日本棋院 Journalist Club 的頒獎(jiǎng)儀式上，Hassabis 曾表示：「2017 年對(duì) AlphaGo 和圍棋界都將是充滿興奮的一年?！谷藗儧]有意識(shí)到，在新的一年還未到來時(shí)，人工智能對(duì)于這項(xiàng)流傳千年的古老技藝的沖擊已經(jīng)開始。

AlphaGo 的系統(tǒng)

AlphaGo 從高調(diào)宣戰(zhàn)開始到 3 月底戰(zhàn)勝李世乭，短短 2 個(gè)多月內(nèi)已經(jīng)博取了無數(shù)的眼球。如今再次出現(xiàn)了一個(gè) Master，它是人?是 AI?還是二者的結(jié)合?業(yè)內(nèi)猜疑不斷。

外行看熱鬧，內(nèi)行看門道。在下棋這件事上我們可能看的是熱鬧(小編著實(shí)不懂棋的套路)，但下圍棋的人工智能系統(tǒng)我們?cè)私膺^。

在一月份的 Nature 封面報(bào)道中，曾詳細(xì)地介紹了 AlphaGo 系統(tǒng)當(dāng)時(shí)所采用的技術(shù)：

首先 DeepMind 使用了如今火熱的深度學(xué)習(xí)技術(shù)，同時(shí)還加上了另一種模擬技術(shù)來對(duì)潛在的步法進(jìn)行建模。深度學(xué)習(xí)需要對(duì)一個(gè)大型的神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練，使其對(duì)數(shù)據(jù)中的模式做出反應(yīng)。

AlphaGo 的關(guān)鍵在于使用的深度神經(jīng)網(wǎng)絡(luò)，而且 DeepMind 在 AlphaGo 中使用了兩種不同的神經(jīng)網(wǎng)絡(luò)：***種叫做策略網(wǎng)絡(luò)(policy network)，用來預(yù)測(cè)下一步;第二種叫做價(jià)值網(wǎng)絡(luò)(value network)，用來預(yù)測(cè)棋盤上不同的分布會(huì)帶來什么不同的結(jié)果。

AlphaGo 使用這兩種網(wǎng)絡(luò)的方法是把非常復(fù)雜的搜索樹減少到可操作的規(guī)模。所以，它并不是在每一步都要考慮幾百種步數(shù)，而只考慮政策網(wǎng)絡(luò)提供的幾十種最有前景的步法，價(jià)值網(wǎng)絡(luò)的作用是減少搜索的深度，所以，它的搜索深度并不是特別深，它并不是一下子搜索出直達(dá)比賽末尾的 300 多步，而是搜索更少的步數(shù)，比如 20 多步，并評(píng)估這些位置，而不是一路評(píng)估到底，看誰最終能贏。搜索并不是靠蠻力，而是與某種與想象力很相似的東西。

DeepMind 官方發(fā)布的 2016 年度總結(jié)中寫道，「最激動(dòng)人心的莫過于 AlphaGo 博弈過程中所呈現(xiàn)出來的創(chuàng)造力，有時(shí)，它的棋招甚至挑戰(zhàn)了古老的圍棋智慧。圍棋，這一古往今來最富深謀遠(yuǎn)慮的游戲之一，AlphaGO 可以識(shí)別并分享其中洞見?！?/p>

就像首位和 AlphaGo 對(duì)戰(zhàn)的專業(yè)選手樊麾在接受機(jī)器之心采訪時(shí)表示：「AlphaGo 可能開辟出另外一種圍棋的美，是我們想象不到的?！?/p>

如果觀看了 AlphaGo 和李世乭的對(duì)弈，你或許不會(huì)對(duì)坐在李世乭對(duì)面的這位感到陌生。他就是 AlphaGo 的核心作者之一 Aja Huang(黃士杰)，而這次代「Master」執(zhí)子的也是黃士杰博士。值得注意的是，黃士杰還是 DeepMind 中唯一一位圍棋高手(業(yè)余圍棋 6 段)，從他的碩博論文《計(jì)算機(jī)圍棋打劫的策略》和《應(yīng)用于計(jì)算機(jī)圍棋之蒙地卡羅樹搜尋法的新啟發(fā)式算法》便可以看出他對(duì)圍棋的熱愛。

2011 年畢業(yè)于臺(tái)灣師范大學(xué)計(jì)算機(jī)信息工程專業(yè)博士班的黃世杰在 2012 年便加入了 DeepMind 團(tuán)隊(duì)，也是該團(tuán)隊(duì)的早期核心成員之一。

在校期間，黃士杰的導(dǎo)師是曾研發(fā) Crazy Stone 的 Rémi Coulom，而 Crazy Stone 正式在 AlphaGo 橫空出世前最有名的圍棋軟件之一。

黃士杰的導(dǎo)師此前在接受媒體報(bào)道時(shí)曾透露，黃士杰讀碩士時(shí)就鎖定圍棋為他的研究課題，為了寫程序，黃士杰有時(shí)在實(shí)驗(yàn)室一呆就是 16 小時(shí)，并將他開發(fā)的圍棋程序以其老婆的英文名「Erica」命名。

下面是黃士杰的論文引用情況。憑借發(fā)表于 Nature 的論文《Mastering the game of Go with deep neural networks and tree search》和另一篇論文《Move Evaluation in Go Using Deep Convolutional Neural Networks》的高引用量，黃士杰僅憑 4 篇論文就在短短兩年時(shí)間內(nèi)獲得大約 388 到 851 之間的引用。

【本文為51CTO專欄“機(jī)器之心”原創(chuàng)稿件，轉(zhuǎn)載請(qǐng)通過微信公眾號(hào)(ID：almosthuman2014)獲取授權(quán)】

戳這里，看該作者更多好文

責(zé)任編輯：武曉燕來源：機(jī)器之心

AlphaGo Master DeepMind

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<p id="pyiip"></p>

<s id="pyiip"><li id="pyiip"></li></s>

<cite id="pyiip"><track id="pyiip"></track></cite><sub id="pyiip"></sub>

<cite id="pyiip"></cite>

^{<thead id="pyiip"></thead>}

<sup id="pyiip"><rt id="pyiip"></rt></sup>