自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

顫抖吧人類!阿爾法狗之后又有了冷撲大師

移動開發(fā) 新聞
恐怕大家都是從阿爾法狗擊敗李世乭這條熱文,才開始關(guān)注AI的吧,然而現(xiàn)在不光有了阿爾法狗,還出了一個冷撲大師,專攻德?lián)涞囊豢預I機器人。

恐怕大家都是從阿爾法狗擊敗李世乭這條熱文,才開始關(guān)注AI的吧,然而現(xiàn)在不光有了阿爾法狗,還出了一個冷撲大師,專攻德?lián)涞囊豢預I機器人。

[[188363]]

首先先來了解下德州撲克與棋類的區(qū)別。圍棋是一種“完美信息游戲”,場面上所有的情況都黑白分明地擺在棋面上,雙方掌握對等的信息。然而,德?lián)渲须[藏了很多信息,是一種“非完美信息游戲”。玩家不知道對手手中是什么牌,不知道五張公共牌會開出怎樣的結(jié)果,也不知道對手猜測自己握有怎樣的手牌。因此,雖然一盤德?lián)涞臎Q策點數(shù)量是10的160次方,要少于圍棋,但光靠搜索是打不了德?lián)涞?。德?lián)溆纱颂隽嗽谒阉髁可系妮^量,對AI提出了另一個方向上的考驗:應對隱藏的信息。

阿爾法狗的幾個基本原理,分別為:走棋網(wǎng)絡(Policy Network),給定當前局面,預測和采樣下一步的走棋;快速走子(Fast rollout),在適當犧牲走棋質(zhì)量的條件下提高速度;價值網(wǎng)絡(Value Network),給定當前局面,估計雙方勝率;蒙特卡羅樹搜索(Monte Carlo Tree Search,MCTS),把以上三個部分串聯(lián)成一個完整的系統(tǒng)。

冷撲大師的算法則主要基于:納什均衡、虛擬遺憾最小化算法(Counterfactual Regret Minimization,CFR)、殘局解算器(end-game solver)和自我強化學習等模塊。

然而對于用戶來說,阿爾法狗和冷撲大師除了能讓我們看看新聞以外,哪個又更有用呢?

在現(xiàn)實生活中,我們遇到的事情會更像玩德?lián)洌荷虡I(yè)談判時對方未知的底牌、房屋拍賣時競爭對手難測的舉動、股票交易中一些隱藏的內(nèi)部消息。桑德霍姆認為,德?lián)銩I打開了靠人工智能解決隨機事件和隱藏信息的大門。這樣的AI,才有望離開虛擬的棋牌世界,成為人類在現(xiàn)實生活中談判、博弈和投資的好幫手。

 

責任編輯:陳琳 來源: 51cto
相關(guān)推薦

2016-12-29 13:34:04

阿爾法狗圍棋計算機

2016-11-29 07:39:18

蘋果iOS科技新聞早報

2019-07-23 09:12:08

2017-05-31 15:47:27

AI人工智能機器學習

2020-09-27 14:28:21

AI 數(shù)據(jù)人工智能

2012-04-06 13:51:01

RIM黑莓

2014-02-19 13:25:45

智能路由Wi-Fi

2018-04-02 16:10:28

人工智能機器人情感智能

2024-11-20 14:30:00

AI圖片

2017-04-12 12:50:31

人工智能谷歌AlphaGo

2016-03-11 11:36:40

服務器

2017-09-27 13:41:32

量子微軟程序猿

2020-12-17 17:20:17

AI人工智能工作崗位

2020-02-10 09:52:27

人工智能機器學習技術(shù)

2021-04-25 15:35:59

鴻蒙HarmonyOS應用

2018-10-20 15:20:10

2018-08-30 08:47:43

人工智能深度學習計算機視覺

2023-04-27 10:27:57

ChatGPT機器狗

2010-02-23 13:48:59

2016-04-08 15:13:29

人工智能阿里小Ai
點贊
收藏

51CTO技術(shù)棧公眾號