自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

柯潔為何說“輸?shù)脹]脾氣”!8個問題解讀人機大戰(zhàn)第一局

人工智能 移動開發(fā)
經(jīng)過四個多小時的對弈,柯潔以四分之一子之差敗給了AlphaGo。

 

經(jīng)過四個多小時的對弈,柯潔以四分之一子之差敗給了AlphaGo。

比賽后,曾參與訓(xùn)練AlphaGo的棋手樊麾,與圍棋九段常昊一同回顧了整個對弈過程??聺嵰才cDeepmind創(chuàng)始人Demis Hassabis,以及AlphaGo的主程序員David Silver一同接受了媒體采訪,談及對比賽的感想。

AlphaGo注重整體局勢的發(fā)展

樊麾提到,在經(jīng)過年初Master的60局比賽后,很多棋手也在嘗試用點三三這種下法。而柯潔也模仿了這種開局。

常昊在分析中表示,對整個棋局印象最深的,是白棋在開局后不久第24手的大飛,這顯示出AlphaGo更更注重中央勢力的發(fā)展,對厚薄和棋局的發(fā)展有更多注重,因為這一步在未來棋局中的效率會更高。

AlphaGo另一個令人印象深刻的也是在開局后不久,在棋局的左上方,采取了一步斷。在斷之前,黑棋(柯潔)看起來很厚,但之后白棋(AlphaGo)也變得厚了。常昊稱,“這是走的一步后手,但卻留下了很多余味。”

第24手“大飛”,第54手“斷”

“這一步帶給了我們新的想法,有些棋不是不能下,下了以后還會有新的思路。它提供了一種思路的創(chuàng)新,我們可以共同去研究,為圍棋的下法帶來更多發(fā)展。”

雖然被圍棋圍住的4個字看起來已經(jīng)沒救了,但AlphaGo依然會更多利用這4個子,它會想把棋盤上所有子的價值都利用起來。

柯潔:輸?shù)脹]脾氣

柯潔在回顧比賽時也對第54手的斷,表示了肯定。他稱,“很震驚,這在人類的下法中是不能有的”。在斷之后,它把自己的腳步實地化,變得更厚,一石二鳥。

柯潔感嘆道,“實在下得太出色了,輸?shù)脹]什么脾氣。”

Demis Hassabis在賽后表示,這是一場非常精彩的比賽,他非常尊敬柯潔,這一戰(zhàn)的表現(xiàn)令人佩服。他認(rèn)為柯潔表現(xiàn)出了頑強與精彩的實力,在賽前也做了很多戰(zhàn)前的準(zhǔn)備。

“柯潔同時做了戰(zhàn)略和戰(zhàn)術(shù)的準(zhǔn)備,比如點三三(這種策略),這是他從年初Master的60場比賽中的總結(jié)。他有自己的戰(zhàn)略,有好幾手都是非常漂亮的。第24手是全盤皆活的一手。接下來還有很多場比賽,我非常尊敬柯潔,讓AlphaGo也必須用全力以赴對付你。”

比賽的結(jié)果雖然有了,但外界對AlphaGo和柯潔的好奇心沒有滿足。在采訪中,雙方也回答了很多大家關(guān)心的問題。

比賽后柯潔為什么笑了?

柯潔稱,這是苦笑,不是很開心的笑。

“很早就知道自己會輸。AlphaGo的每一步棋都是勻速的,到***時已經(jīng)知道會輸多少了。”

對于自己的評價,柯潔稱,“AlphaGo下得很精彩,但我自己也盡了全力。它下得太好了,有很多地方值得棋手去學(xué)習(xí)和探索。它對圍棋的理念帶來了沖擊,在改變我們最初對圍棋的下法,沒什么棋是不能下的。對AlphaGo的想法也有改變,我們可以大膽去創(chuàng)新,開拓自己的思維,可以自由地去下棋。今天也是大膽地開拓了自己的思維。”

柯潔還曾想用AlphaGo的策略來對付它。“我的印象中AlphaGo是會非常貪戀實地的,比如點三三的方法,今天我也是在使用這種策略。但這種意圖被AlphaGo打敗了,完全進入了它的調(diào)子中。它真的下得非常的好。”

柯潔認(rèn)為,AlphaGo的棋與去年完全是兩個人。***次時它很接近人的,但現(xiàn)在越來越像“上帝”。

AlphaGo有弱點嗎?

柯潔認(rèn)為,弱點暫時沒有看見。以前還是有弱點的,但現(xiàn)在AlphaGo對棋的理解與判斷已經(jīng)遠(yuǎn)勝于我們?nèi)祟惲?,贏的話只能找一些bug出來。

但他同時說,“對自己永遠(yuǎn)要有信心。”

Hassabis稱,在李世石后再次參加比賽,就是希望棋手們能找到AlphaGo的弱點,找到它跟自己對弈時不知道的缺陷。

“李世石當(dāng)時在第4局找到了這個缺口,后來我們改善了體系。當(dāng)然還會有新的領(lǐng)域,我們和AlphaGo都不知道,所以才會參加比賽。”

David Silver解釋稱,AlphaGo的做法是將它的獲勝的概率***化,而不是接近式贏得比賽。它會尋找一些確定的路線,實現(xiàn)少風(fēng)險的獲勝機會。這也是一個取舍問題,要決定如何擴大勝利的比例。當(dāng)然,它還有一些其它目標(biāo),比如將勝利的步伐邁得更大,如果重點只是放在獲勝上,它可能會降低風(fēng)險,即使很小的風(fēng)險也會去關(guān)注。

對圍棋的影響?

Hassabis認(rèn)為,圍棋是一個非常有意思的主題,它有***的可能性。通過比賽,可以改進對于圍棋的理解,這是我們可以用的工具,讓偉大的棋手發(fā)現(xiàn)更多圍棋的奧妙。

AlphaGo完全不依賴棋手的訓(xùn)練嗎?

David Silver解釋稱,AlphaGo一開始就是跟人類來學(xué)習(xí)的,它通過自身對弈來學(xué)習(xí)時,也必須要跟人類專家對弈才行,因為與***的棋手對決才能改善。新版本是更多與自身對弈來學(xué)習(xí),實現(xiàn)自我的搜索,對人類數(shù)據(jù)的依賴更小了。而DeepMind的目標(biāo)是讓它的規(guī)則超越圍棋,應(yīng)用到其它領(lǐng)域。

戰(zhàn)勝位于圍棋頂端的柯潔后,AlphaGo是否就此隱退?

對這一問題,Hassabis沒有正面回應(yīng),只是表示,本周晚些時候會宣布下一步怎么做。像***版在學(xué)術(shù)期刊上發(fā)布了技術(shù)細(xì)節(jié)一樣,他們以后也會發(fā)布更多新版本的細(xì)節(jié),會披露更多技術(shù)細(xì)節(jié),讓其它團隊與實驗室做自己的版本。

技術(shù)細(xì)節(jié)?多少個TPU?單機版?

這次比賽的AlphaGo是新版本,它改善了新的算法,主要進步是計算量少了十倍,自我對弈更強。

Hassabis稱,在比賽中程序是在一個單一的機器上運作的,這與去年不一樣,當(dāng)時是分布式的。這次有更強大的算法,運作起來更簡單也更好,獲得的速度更快。

Hassabis表示,計算力可以“在Google云中獲得,用的是TPU,十個處理單位,少了十倍的計算量”。簡單點說,這次的AlphaGo是單機版。

柯潔再也不與人工智能比了?

賽前,柯潔發(fā)微博表示,這次比賽是***三場與人工智能的比賽。賽后,他對這一決定再次做了確認(rèn)。

“考慮了很久,AlphaGo進步太快了,每一步都是巨大的進步,在以后會更加***,而人與它的差距不是靠自己的努力就能去彌補的。我相信科技的力量,未來是人工智能的。對圍棋來說,我還是喜歡和人來下,因為機器與人的差距會越來越大,人贏的概率會越來越小,這樣下棋太痛苦了,一盤都贏不了。”

他表示,以后也不會去訓(xùn)練機器了,這是***的三盤棋。

“希望以后還是下人類的棋,對軟件把它當(dāng)作一個老師,一個學(xué)習(xí)的對象去看待。”

他表示,對自己的表現(xiàn)也有點不滿意,覺得自己可以做得更好,但有時候無論怎么努力都無法做到。所以這***一次,他希望不留遺憾,下出讓自己滿意的棋局。

“令A(yù)lphaGo的主機發(fā)燙也好。”

那如果人類棋手不想和AlphaGo打了怎么辦?

Hassabis表示,從他們的角度來說,想要AlphaGo作為圍棋的工具,能為人類所用,所以會有架構(gòu)知識的分享,讓大家知道它。也希望它能走進尋常百姓家,在醫(yī)學(xué)與科學(xué)找到應(yīng)用場景。

責(zé)任編輯:林師授 來源: 雷鋒網(wǎng)
相關(guān)推薦

2017-05-23 14:56:15

柯潔人機大戰(zhàn)AlphaGo

2018-04-20 15:18:55

柯潔星陣圍棋

2017-04-11 08:00:38

AlphaGoAI

2017-08-29 09:42:03

柯潔阿爾法狗機智過人

2017-05-18 12:40:44

AlphaGoAI柯潔

2023-09-18 11:24:00

ChatGPTAI

2017-06-12 13:59:11

2011-02-24 17:12:48

IBMwatson

2021-11-01 07:38:02

前端技術(shù)編程

2013-11-01 10:14:31

輕應(yīng)用百度

2014-05-22 15:53:41

Windows 8國產(chǎn)操作系統(tǒng)

2017-04-13 16:58:21

互聯(lián)網(wǎng)

2018-04-16 10:14:37

2016-02-22 10:46:02

Java排行第一

2012-02-13 09:29:22

甲骨文安騰惠普

2018-08-10 07:48:53

物聯(lián)網(wǎng)安全物聯(lián)網(wǎng)IOT

2021-08-06 22:33:18

機器人高考人工智能

2018-04-15 22:17:20

PHP引用變量

2015-02-28 10:17:03

FDD-LTE工信部

2023-08-02 08:01:14

柯里化反柯里化
點贊
收藏

51CTO技術(shù)棧公眾號