區(qū)塊鏈與機器學(xué)習(xí)如何創(chuàng)造出最給力的人工智能?
通過基于區(qū)塊鏈市場的數(shù)據(jù)訓(xùn)練獲得機器學(xué)習(xí)模型,能夠有潛力來創(chuàng)造世界上***影響力的人工智能。他們將兩個部分組合起來:私有機器學(xué)習(xí),這可以進行在私密信息上進行訓(xùn)練,而且不用泄露信息,同時基于區(qū)塊鏈給予激勵,這樣做可以讓這些系統(tǒng)吸引***的數(shù)據(jù)和模型,讓它們更加聰明。***的結(jié)果會組成一個開放式的市場,任何人可以售出他們的數(shù)據(jù)并且保留私密數(shù)據(jù),同時開發(fā)人員也可以通過激勵為他們的算法吸引***的數(shù)據(jù)。
建造這些系統(tǒng)是非常具有挑戰(zhàn)性的,所需要的建造基石也正在創(chuàng)建,但是從現(xiàn)在的簡單初始版本看起來,這是有可能的。我相信這些市場會將我們從現(xiàn)在的Web 2.0時代轉(zhuǎn)移到代碼和算法開放競爭的Web3.0時代,并且這些算法和數(shù)據(jù)都可以直接獲得收益。
起源
這個想法來自于2015年和來自Numerai基金的Richard之間的討論。Numerai是一個對沖基金,它會把加密貨幣市場的數(shù)據(jù)發(fā)送給任何想要和做股票市場模型的數(shù)據(jù)專家。Numerai將***的模型提交到一個“元模型“,交易這個元模型,并且支付給建立這些模型平臺的數(shù)據(jù)科學(xué)家費用。
讓數(shù)據(jù)科學(xué)家進行競爭看起來是個非常好的主意。所以這就帶來了更多思考:我們能夠建立一個完全去中心化版本的系統(tǒng),能夠應(yīng)用任何場景?我認識這個答案是肯定的。
創(chuàng)建
舉例來說,我們嘗試在去中心化交易所上建立完全去中心化的系統(tǒng)來交易數(shù)字貨幣。這是眾多潛在的創(chuàng)建方法之一。
數(shù)據(jù) 數(shù)據(jù)提供者以數(shù)據(jù)為權(quán)益并且給模型建立者使用。
模型建立建模人員選擇需要使用什么數(shù)據(jù)并且創(chuàng)建模型。培訓(xùn)使用安全的計算方式進行,這也允許模型可以在不需要泄露底層數(shù)據(jù)的情況下進行訓(xùn)練。模型需要有不同權(quán)重。

建立元模型元模型是基于考慮到每個模型權(quán)重的算法上而創(chuàng)建的。
創(chuàng)建元模型是可選的—你可以想象很多模型沒有和元模型結(jié)合使用。
使用元模型智能合約使用元模型并且通過去中心化交易機制在鏈上進行交易。
分發(fā)收益/損失 在一段時間后,交易會產(chǎn)生收益或者損失。這部分利潤或者損失就會基于貢獻多少分發(fā)給這個元模型的貢獻者。那些做出負貢獻的模型會被拿走部分或者全部的抵押資金。
驗證計算對每步的計算是中心化的,但是驗證和挑戰(zhàn)會使用像Truebit或者使用安全多重計算的去中心化系統(tǒng)。
存儲 數(shù)據(jù)和模型會存儲在類似IPFS或者在多重角色計算網(wǎng)絡(luò)的節(jié)點上,因為鏈上的存儲會太昂貴。
是什么驅(qū)動了這樣的系統(tǒng)?
吸引全球***數(shù)據(jù)的激勵 吸引數(shù)據(jù)的激勵模式是這個系統(tǒng)最重要的部分,因為數(shù)據(jù)是機器學(xué)習(xí)的限制因素。同樣,比特幣通過開放的激勵建立了世界上***大的算力網(wǎng)絡(luò),合適的數(shù)據(jù)激勵架構(gòu)也會吸引世界上***的數(shù)據(jù)來為你應(yīng)用。并且?guī)缀醪豢赡芙箒碓从趲浊Щ蛘甙偃f處的數(shù)據(jù)。
- 代碼間的競爭 在模型/代碼間創(chuàng)建公開的競爭,這之前從未出現(xiàn)過。在去中心化的Facebook上發(fā)布幾千個競爭性的新聞發(fā)送算法。
- 獎勵透明 數(shù)據(jù)和模型的提供者可以看到他們獲得了和提交任務(wù)相關(guān)的公平收益,因為所有計算都是可驗證的,這會使得人們更加愿意參加這類項目。
- 自動化 通過鏈上操作,并且直接從token上獲得價值,創(chuàng)建了自動化和無需信任的閉環(huán)回路。
- 網(wǎng)絡(luò)效果 多面網(wǎng)絡(luò)會受到用戶,數(shù)據(jù)提供者和數(shù)據(jù)專家的影響,這也使得系統(tǒng)自我強化。系統(tǒng)能夠表現(xiàn)的更好,就會吸引更多的資本,這也意味著更有潛力的回報,會吸引更多的數(shù)據(jù)提供者和數(shù)據(jù)專家,他們會讓系統(tǒng)更加智能,從而吸引更多資本,形成良性循環(huán)。
隱私
除了以上所說的點,一個主要的功能就是隱私性。它可以讓1)用戶提交太隱私并且不能分享的數(shù)據(jù) 2)防止數(shù)據(jù)的經(jīng)濟價值和模型被破壞。如果讓非加密數(shù)據(jù)公開,數(shù)據(jù)和模型就可以免費復(fù)制并且被別人使用,但是那些人卻沒有作任何貢獻(“搭便車”問題)
解決這個問題的部分方案是將數(shù)據(jù)銷售隱私化。盡管買家選擇重新銷售或者釋放數(shù)據(jù),它的價值也會隨時間減少。但是,這種方法限制了短期使用案例,并且也還是存在典型的隱私問題。因此,更為復(fù)雜但是有效的解決方案就是使用某種安全計算方法。
安全計算
安全計算方法讓模型可以在不泄露數(shù)據(jù)本身的基礎(chǔ)上進行訓(xùn)練。現(xiàn)在使用和研究的安全計算方法有3種方式:同態(tài)加密(HE), 多方安全計算(MPC)和零知識證明(ZKPs)。多方計算目前是私人機器學(xué)習(xí)使用最廣泛的算法,因為同態(tài)加密太慢,而且對于如何將零知識證明加入到機器學(xué)習(xí)中也不是很明顯。安全計算方法是計算機科學(xué)研究的前沿。他們通常會比普通的計算慢到指數(shù)級,體現(xiàn)了這個系統(tǒng)的瓶頸,但是這些年提高了很多。
***推薦系統(tǒng)
為了描述私人機器學(xué)習(xí)的潛力,假設(shè)有一個叫做“***推薦系統(tǒng)”的app。它可以通過你的設(shè)備看到你在做的任何事情:你的瀏覽歷史,你在app上做的任何事情,手機里面的圖片,定位數(shù)據(jù),消費記錄,可穿戴傳感器,信息內(nèi)容,你家里的攝像頭,AR眼睛上的攝像頭等等。然后它會給你建議:你應(yīng)該訪問的下個網(wǎng)站,需要閱讀的文章,要聽的音樂或者是要買的產(chǎn)品。
這個推薦系統(tǒng)會非常有用。谷歌,F(xiàn)acebook或者其他現(xiàn)有的數(shù)據(jù)庫可能都不會有這樣的系統(tǒng)因為它對于你有***的縱向視圖,并且這個系統(tǒng)可以從你的私密不可泄漏的信息中學(xué)習(xí)。和之前說到的數(shù)字貨幣交易系統(tǒng)的案例類似,它會通過關(guān)注不同領(lǐng)域的模型(例如:網(wǎng)站推薦,音樂)來運作,進行競爭來獲得用戶加密數(shù)據(jù)的準入以及像用戶進行推薦,也許甚至是因為用戶貢獻了數(shù)據(jù)以及對推薦的東西進行專注而像他們付費。谷歌的聯(lián)合學(xué)習(xí)和蘋果的差分隱私是這個私人機器學(xué)習(xí)方向的一個步驟,但是仍然需要信任,不會允許用戶直接檢驗安全性,并且讓數(shù)據(jù)保持隱秘。
什么樣的方案可能會首先實行?
我無法非常精確地說明什么樣的構(gòu)造是***的,但是我有一些想法。我用來評估區(qū)塊鏈方案的一個準則是:從物理原生,到數(shù)字原生再到區(qū)塊鏈原生的一系列研究,越區(qū)塊鏈原生,那么就越好。越不那么區(qū)塊鏈原生,那么就需要更多的第三方介入,使得增加復(fù)雜性和減少使用與其他系統(tǒng)作為構(gòu)建塊的易用性。
在這兒,我認為如果系統(tǒng)中價值創(chuàng)造是合格的,那么這意味著系統(tǒng)更可能會成功運行—直接來說就是以法幣的方式,更好的選擇就是代幣。這樣就會完成一個純粹,閉環(huán)的系統(tǒng)??梢詫⒅暗募用茇泿沤灰紫到y(tǒng)和X光線腫瘤識別系統(tǒng)相比較。對后者來說,你需要說服保險公司X光線模型是由價值的,并且去協(xié)商多么有價值,然后相信一小部分現(xiàn)在的人從而嚴重模型的成功/失敗。
這并不是說社會使用數(shù)字原生系統(tǒng)的正和情況不會發(fā)生。就像之前提到的推薦系統(tǒng)也會非常有用。如果和數(shù)字市場聯(lián)系,有另一種使用案例是模型可以在鏈上進行代碼運行,并且系統(tǒng)的獎勵是代(對于數(shù)字市場案例而言),這樣會會創(chuàng)造一個純粹的閉環(huán)。現(xiàn)在看起來可能還不是很明朗,但是我期待基于區(qū)塊鏈的原生任務(wù)會隨著時間而逐漸擴大。
影響
首先,去中心化機器學(xué)習(xí)市場可以去除現(xiàn)有技術(shù)巨頭對數(shù)據(jù)的壟斷。他們在過去20年標準化以及商品化了互聯(lián)網(wǎng)價值創(chuàng)造的主要資源:專有的數(shù)據(jù)網(wǎng)絡(luò)和他們周邊的強大網(wǎng)絡(luò)效應(yīng)。因此,價值創(chuàng)造從數(shù)據(jù)往算法層面開始轉(zhuǎn)移。

技術(shù)上的標準化和商業(yè)化循環(huán),我們現(xiàn)在正處在互聯(lián)網(wǎng)時代價值壟斷的末尾。換句話說,他們?yōu)锳I創(chuàng)造了一個直觀的商業(yè)模式。
其次,去中心化機器學(xué)習(xí)市場創(chuàng)造了世界上***力量的AI系統(tǒng),通過直接的經(jīng)濟激勵吸引了世界上***的數(shù)據(jù)和模型。他們的強處隨著多方網(wǎng)絡(luò)的效率而增強。由于互聯(lián)網(wǎng)2.0時代數(shù)據(jù)網(wǎng)絡(luò)壟斷成為商業(yè)化,他們看起來像是下個重新聚合點的候選人。可能我們還需要幾年時間,但是這個方向是正確的。
第三,就像推薦系統(tǒng)展示的那樣,搜索發(fā)生了倒置。人們不會去搜索產(chǎn)品,而是產(chǎn)品進行搜索同時競爭為人們服務(wù)。每個人也許都有自己喜愛的市場,推薦系統(tǒng)就可以將最相關(guān)的內(nèi)容展示,并且這些內(nèi)容和個人定義的很相關(guān)。
第四,去中心化機器學(xué)習(xí)市場可以讓我們獲得和Google和Facebook同樣的收益,并且還不需要給出我們的數(shù)據(jù)。
第五,機器學(xué)習(xí)可以更快速地發(fā)展,因為任何工程師都可以進入到開放的市場獲取數(shù)據(jù),而不是只有在Web2.0時代的那幾所大公司的小群體工程師。
挑戰(zhàn)
首先,安全計算模型現(xiàn)在運行速度很慢并且機器學(xué)習(xí)在計算方面已經(jīng)很昂貴了。另一方面,安全計算的性能也在逐漸提升。我也看到一些方案可以在過去6個月內(nèi)完成HE,MPC和ZKP的重大性能提升。計算出特定的數(shù)據(jù)或者模型值并提供給元模型是很困難的。清理和格式化擁擠的數(shù)據(jù)是具有挑戰(zhàn)性的。我們希望看到工具,標準化和小型企業(yè)能夠聯(lián)合解決這個問題。***,創(chuàng)建這種系統(tǒng)的廣義構(gòu)造的業(yè)務(wù)模型比創(chuàng)建一個單獨的實例更不明朗。這對于很多新的加密事物都是正確的,包括精選市場。
結(jié)論
私人機器學(xué)習(xí)和區(qū)塊鏈激勵的組合可以在廣泛不同的應(yīng)用中創(chuàng)造***的機器智慧。但是仍然有幾個非常嚴重的技術(shù)挑戰(zhàn)。他們的長期潛力是巨大的,并且會改變現(xiàn)有大型互聯(lián)網(wǎng)公司擁有數(shù)據(jù)的現(xiàn)狀。這其實也有點恐怖,因為這類系統(tǒng)可以存在,自我增強,消費私密數(shù)據(jù),并且?guī)缀醪豢赡鼙魂P(guān)閉,讓我在想是否創(chuàng)造他們會召喚個更加強大的摩洛克。不論如何,這是加密貨幣如何緩慢發(fā)展,然后突然進入任何行業(yè)的另一個案例。