自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

基于博弈論的大規(guī)模數(shù)據(jù)分析

人工智能 數(shù)據(jù)分析
現(xiàn)代 AI 系統(tǒng)可以像勤奮的學(xué)生準(zhǔn)備考試一樣,去處理諸如識(shí)別圖像中的對(duì)象以及預(yù)測(cè)蛋白質(zhì) 3D 結(jié)構(gòu)之類的任務(wù)。通過(guò)大量示例問(wèn)題訓(xùn)練,這類系統(tǒng)可以逐漸降低錯(cuò)誤,直至取得成功。

現(xiàn)代 AI 系統(tǒng)可以像勤奮的學(xué)生準(zhǔn)備考試一樣,去處理諸如識(shí)別圖像中的對(duì)象以及預(yù)測(cè)蛋白質(zhì) 3D 結(jié)構(gòu)之類的任務(wù)。通過(guò)大量示例問(wèn)題訓(xùn)練,這類系統(tǒng)可以逐漸降低錯(cuò)誤,直至取得成功。

但這是一項(xiàng)需要獨(dú)自完成的工作,并且只是已知的學(xué)習(xí)形式之一。學(xué)習(xí)也需要與他人互動(dòng)和交流。一個(gè)單獨(dú)的個(gè)體很難自行解決極其復(fù)雜的問(wèn)題。通過(guò)讓問(wèn)題解決方案具有類游戲的特質(zhì),DeepMind 之前在研究中已經(jīng)訓(xùn)練了 AI 智能體 (Agent) 來(lái)玩奪旗賽并在《星際爭(zhēng)霸》中達(dá)到大師級(jí)水平。因此,我們希望了解基于,以博弈論為模型的視角能否幫助解決其他基本的機(jī)器學(xué)習(xí)問(wèn)題。

[[419288]]

最近,在 2021 年 ICLR 上,我們發(fā)表了論文 “EigenGame:將 PCA 作為納什均衡 (EigenGame: PCA as a Nash Equilibrium)”,并獲得杰出論文獎(jiǎng)。我們的研究探索了一種解決舊問(wèn)題的新方法:我們將主成分分析 (PCA)(一種特征值問(wèn)題)重新表述為競(jìng)爭(zhēng)性的多智能體博弈游戲,即 EigenGame。PCA 通常表現(xiàn)為優(yōu)化問(wèn)題(或單智能體問(wèn)題);但是,我們發(fā)現(xiàn)多智能體視角可使我們利用最新的計(jì)算資源生成新的數(shù)據(jù)分析和算法。這使得我們能夠?qū)⒅鞒煞址治鰯U(kuò)展到以往計(jì)算密集型的大規(guī)模數(shù)據(jù)集,并為未來(lái)的研究探索提供一種替代方法。

將 PCA 作為納什均衡

PCA (Principal component analysis) 最早于 20 世紀(jì)初期提出,之后便成為了分析高維數(shù)據(jù)結(jié)構(gòu)長(zhǎng)期使用的一項(xiàng)技術(shù)?,F(xiàn)在,這種方法已普遍用作數(shù)據(jù)處理流水線中的第一步,簡(jiǎn)化了集群和可視化數(shù)據(jù)。同時(shí),它也是學(xué)習(xí)低維表示以進(jìn)行回歸和分類的實(shí)用工具。自 PCA 提出后的一個(gè)多世紀(jì),我們?nèi)匀挥谐浞值睦碛蓪?duì)其進(jìn)行學(xué)習(xí)和研究。

首先,數(shù)據(jù)最初是由人工用紙筆記錄,而現(xiàn)在則存儲(chǔ)在像倉(cāng)庫(kù)一樣大的數(shù)據(jù)中心。結(jié)果,這種熟悉的分析方式成為了計(jì)算瓶頸。研究人員已經(jīng)探索了隨機(jī)算法和其他方向來(lái)改善 PCA 的擴(kuò)展方式,但是我們發(fā)現(xiàn),這些方法難以擴(kuò)展到大規(guī)模數(shù)據(jù)集,因?yàn)樗鼈儫o(wú)法完全利用計(jì)算領(lǐng)域以深度學(xué)習(xí)為中心的最新進(jìn)展:即訪問(wèn)多個(gè)并行 GPU 或 TPU。

其次,PCA 與許多重要的機(jī)器學(xué)習(xí)和工程問(wèn)題都需要使用共同的解決方案,即奇異值分解 (SVD)。通過(guò)以正確的方式解決 PCA 問(wèn)題,我們的數(shù)據(jù)分析和算法將更廣泛地應(yīng)用于機(jī)器學(xué)習(xí)樹的各個(gè)分支。 

圖 1 以 SVD 為根基的知識(shí)樹涵蓋了機(jī)器學(xué)習(xí)中的多個(gè)基本概念,包括 PCA、最小二乘法、譜聚類、原型值函數(shù)、潛在語(yǔ)義索引和排序 

與任何棋盤游戲一樣,為了將 PCA 重新設(shè)計(jì)為游戲,我們需要制定一套規(guī)則和目標(biāo)讓玩家遵循。設(shè)計(jì)此類游戲的方式有很多種;但是,重要的設(shè)計(jì)理念源自 PCA 本身:最佳解決方案由特征向量組成,而特征向量捕獲數(shù)據(jù)中的重要方差并且彼此正交。 

圖 2 每個(gè)玩家都希望與最大方差(數(shù)據(jù)傳播范圍更大)的方向保持一致,但也希望與層次結(jié)構(gòu)(編號(hào)較低的所有玩家)中的高層級(jí)的玩家保持垂直 

在 EigenGame 中,每個(gè)玩家都控制一個(gè)特征向量。玩家通過(guò)解釋數(shù)據(jù)中的方差來(lái)提高得分,但如果他們與其他玩家過(guò)于相似,則會(huì)受到懲罰。我們還建立了一個(gè)層次結(jié)構(gòu):玩家 1 只關(guān)注最大化方差,而其他玩家則還必須關(guān)注如何最小化與層級(jí)結(jié)構(gòu)中高于自己的玩家的相似度。這種獎(jiǎng)勵(lì)和懲罰的組合決定了每個(gè)玩家的效用。 

圖 3 總結(jié)上方每個(gè)玩家的效用 

通過(guò)經(jīng)適當(dāng)設(shè)計(jì)的方差 Var 和對(duì)齊 Align 項(xiàng),我們證明了:

  • 如果所有的玩家都表現(xiàn)最優(yōu),他們則一起實(shí)現(xiàn)了游戲的納什均衡點(diǎn),而這就是 PCA 算法的解決方案。
  • 如果每個(gè)玩家單獨(dú)且同步使用梯度上升法來(lái)最大化其效用,則可實(shí)現(xiàn)該目標(biāo)。

 

圖 4 EigenGame 引導(dǎo)每個(gè)玩家沿著單位球面從空的圓圈走向平行的箭頭。藍(lán)色代表玩家 1,紅色代表玩家 2,綠色代表玩家 3 

這種同步上升的獨(dú)立性特別重要,因?yàn)樗试S將計(jì)算分布在數(shù)十個(gè) Google Cloud TPU 上,從而實(shí)現(xiàn)數(shù)據(jù)和模型并行。這使我們的算法適應(yīng)真正的大規(guī)模數(shù)據(jù)成為了可能。EigenGame 可以在數(shù)小時(shí)內(nèi)找到包含數(shù)百萬(wàn)個(gè)特征或數(shù)十億行的上百兆字節(jié)數(shù)據(jù)集的主要成分。 

圖 5 每個(gè)彩色正方形都是一個(gè)單獨(dú)的設(shè)備。(L) 每個(gè)玩家在單個(gè)設(shè)備上運(yùn)行并計(jì)算更新。(R) 將每個(gè)玩家復(fù)制到多個(gè)設(shè)備,并使用獨(dú)立的一批數(shù)據(jù)計(jì)算更新;然后平均不同的更新以形成更可靠的更新方向 

效用、更新及兩者之間的一切

通過(guò)從多智能體角度審視 PCA,我們能夠提出可擴(kuò)展的算法和新穎的分析方法。我們還發(fā)現(xiàn)了與赫布學(xué)習(xí) (Hebbian Learning) 存在的驚人聯(lián)系,或者也可以說(shuō)神經(jīng)元在學(xué)習(xí)時(shí)如何調(diào)整適應(yīng)。在 EigenGame 中,每個(gè)最大化效用的玩家都會(huì)產(chǎn)生更新方程,該方程類似于從關(guān)于大腦中突觸可塑性的赫布模型中衍生的更新規(guī)則。我們已知赫布更新可以收斂到 PCA 解決方案,但不能作為任何效用函數(shù)的梯度導(dǎo)出。博弈論為我們提供了一個(gè)新的視角來(lái)研究赫布學(xué)習(xí),也為機(jī)器學(xué)習(xí)問(wèn)題提供了一系列的解決方法。

機(jī)器學(xué)習(xí)連續(xù)曲線的一端是提出可優(yōu)化的目標(biāo)函數(shù)的完善路徑:使用凸優(yōu)化和非凸優(yōu)化理論,研究人員可以對(duì)解決方案的整體性質(zhì)進(jìn)行推理。而在另一端上,則直接指定了受神經(jīng)科學(xué)啟發(fā)的純聯(lián)結(jié)主義方法和更新規(guī)則,但是這可能增加了對(duì)整個(gè)系統(tǒng)的分析難度,常常需要研究復(fù)雜的動(dòng)力系統(tǒng)。

像 EigenGame 這樣的游戲理論方法則介于兩者之間。玩家更新將不受限于函數(shù)的梯度,而只是對(duì)其他玩家當(dāng)前策略的最佳響應(yīng)。我們可以自由設(shè)計(jì)具有必要屬性的效用函數(shù)程序和更新,例如,指定無(wú)偏或加速的更新,同時(shí)確保納什屬性仍然允許我們對(duì)整個(gè)系統(tǒng)進(jìn)行分析。 

圖 6 允許使用多個(gè)效用函數(shù)彌合了優(yōu)化方法和動(dòng)態(tài)系統(tǒng)之間的鴻溝 

EigenGame 形象地展示了如何將機(jī)器學(xué)習(xí)問(wèn)題的解決方案設(shè)計(jì)為大型多智能體系統(tǒng)的輸出。一般而言,將機(jī)器學(xué)習(xí)問(wèn)題設(shè)計(jì)為多智能體游戲是頗具挑戰(zhàn)性的機(jī)制設(shè)計(jì)問(wèn)題;但是,研究人員已經(jīng)使用兩個(gè)玩家間的這類零和博弈來(lái)解決機(jī)器學(xué)習(xí)問(wèn)題。最值得注意的是,生成對(duì)抗網(wǎng)絡(luò) (GAN) 這一生成建模方法的成功吸引了人們對(duì)博弈論與機(jī)器學(xué)習(xí)之間關(guān)系的興趣。

EigenGame 超越了這一點(diǎn),進(jìn)入了更為復(fù)雜的多玩家非零和博弈設(shè)置。這優(yōu)化了并行性,從而能夠支持更大的規(guī)模和速度。它還為機(jī)器學(xué)習(xí)的相關(guān)社區(qū)提供了可量化的基準(zhǔn),以測(cè)試新穎的多智能體算法以及更豐富的領(lǐng)域,例如外交風(fēng)云和足球。

我們希望我們的效用和更新設(shè)計(jì)藍(lán)圖能夠鼓勵(lì)其他人探索設(shè)計(jì)算法、智能體和系統(tǒng)的新方向。我們期待未來(lái)能看到其他問(wèn)題也可表述為游戲,以及我們收集的數(shù)據(jù)分析是否會(huì)進(jìn)一步增進(jìn)我們對(duì)多智能體的智能本質(zhì)的理解。

 

責(zé)任編輯:未麗燕 來(lái)源: 谷歌開(kāi)發(fā)者
相關(guān)推薦

2013-04-27 09:09:07

大數(shù)據(jù)全球技術(shù)峰會(huì)

2024-04-02 14:29:12

網(wǎng)絡(luò)安全數(shù)據(jù)泄露

2016-10-12 09:22:51

數(shù)據(jù)分析技術(shù)Apache Kyli

2021-09-24 11:34:44

MaxCompute Python 數(shù)據(jù)分析

2022-06-24 09:00:00

數(shù)據(jù)管理數(shù)據(jù)卷數(shù)據(jù)存儲(chǔ)

2009-07-06 18:12:07

金融危機(jī)創(chuàng)新博科資訊

2023-10-26 01:26:04

Vaex數(shù)據(jù)數(shù)據(jù)集

2023-12-15 10:16:51

容器工具數(shù)據(jù)

2020-06-10 10:00:53

Serverless數(shù)據(jù)處理函數(shù)

2020-07-23 14:03:09

數(shù)據(jù)中心數(shù)據(jù)網(wǎng)絡(luò)

2024-08-21 15:14:21

2015-10-15 14:13:56

博弈論數(shù)據(jù)科學(xué)家

2016-05-30 12:08:14

2022-12-30 14:14:51

數(shù)據(jù)中心服務(wù)器

2019-12-25 10:46:13

Python 開(kāi)發(fā)編程語(yǔ)言

2017-01-11 15:54:53

SDN網(wǎng)絡(luò)數(shù)據(jù)中心中國(guó)移動(dòng)

2021-03-24 11:13:12

數(shù)據(jù)中心云計(jì)算物聯(lián)網(wǎng)

2009-03-24 10:19:00

IP交換電路交換分組交換

2024-09-13 13:36:29

2020-12-11 19:52:06

數(shù)據(jù)中心超大規(guī)模數(shù)據(jù)中心
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)