自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

區(qū)塊鏈數(shù)據(jù)分析很大的挑戰(zhàn)

區(qū)塊鏈 大數(shù)據(jù)
在最近的會(huì)議演講中我經(jīng)常會(huì)被問到:區(qū)塊鏈數(shù)據(jù)分析很大的挑戰(zhàn)是什么? 我的回答就一個(gè)詞:去匿名化。我堅(jiān)定地認(rèn)為,識(shí)別不同類型的參與者并 理解其行為是解鎖區(qū)塊鏈分析潛力的核心挑戰(zhàn)

 在最近的會(huì)議演講中我經(jīng)常會(huì)被問到:區(qū)塊鏈數(shù)據(jù)分析很大的挑戰(zhàn)是什么? 我的回答就一個(gè)詞:去匿名化。我堅(jiān)定地認(rèn)為,識(shí)別不同類型的參與者并 理解其行為是解鎖區(qū)塊鏈分析潛力的核心挑戰(zhàn)。我們花費(fèi)了相當(dāng)多的時(shí)間來(lái) 考慮這個(gè)問題以識(shí)別出與數(shù)字貨幣運(yùn)動(dòng)的倫理不發(fā)生沖突的正確邊界。在 這篇文章里,我想進(jìn)一步探討這個(gè)思路。

[[284177]]

市場(chǎng)上大多數(shù)區(qū)塊鏈的架構(gòu)依賴于匿名或偽匿名機(jī)制來(lái)保護(hù)其節(jié)點(diǎn)的隱私 并實(shí)現(xiàn)去中心化。數(shù)據(jù)混淆機(jī)制可以將加密資產(chǎn)交易數(shù)據(jù)記錄在公開的 賬本上讓每個(gè)人都能訪問,但是也讓分析這些數(shù)據(jù)變得異常困難。如果不能 識(shí)別參與者的身份,就很難理解區(qū)塊鏈數(shù)據(jù)集并分析出有意義的結(jié)果,而且 區(qū)塊鏈分析只能徘徊在初級(jí)階段。然而,重要的一點(diǎn)是要理解,去匿名化 區(qū)塊鏈數(shù)據(jù)集并不是要知道賬本中每個(gè)地址的真實(shí)身份,這個(gè)方向基本上是 不具備可擴(kuò)展性的可能。相反的,我們可以識(shí)別并理解區(qū)塊鏈中已知參與者 的行為,例如交易所、OTC柜臺(tái)、礦工以及其他構(gòu)成區(qū)塊鏈生態(tài)系統(tǒng)的核心 成員。

并非所有的地址都一樣

網(wǎng)絡(luò)的量度是區(qū)塊鏈分析中無(wú)所不在的一個(gè)指標(biāo),也是一個(gè)可以清晰地展示 去匿名化威力的指標(biāo)。地址數(shù)量是最常見的一個(gè)具有誤導(dǎo)性的指標(biāo),因?yàn)? 并非所有的地址都同等重要。交易創(chuàng)建的一個(gè)用于臨時(shí)性轉(zhuǎn)賬的地址,顯然 不能和另一個(gè)長(zhǎng)期持有資產(chǎn)的錢包地址相提并論。類似的,像幣安這樣的 交易所的熱錢包,肯定也不同和我的個(gè)人錢包采用同樣的方法和指標(biāo)去分析。 同等對(duì)待所有地址的匿名性,注定會(huì)導(dǎo)致解讀的有限性并且經(jīng)常會(huì)得出誤導(dǎo)性的結(jié)論。

匿名性 vs. 可解讀性

匿名或偽匿名身份是可伸縮的去中心化架構(gòu)的關(guān)鍵因素之一,但是這也讓 從區(qū)塊鏈數(shù)據(jù)集中獲取有價(jià)值的信息變得極端困難。理解這一觀點(diǎn)的一個(gè) 辦法,就是把匿名性視為區(qū)塊鏈分析的可解讀性的一個(gè)反因子。

在區(qū)塊鏈數(shù)據(jù)集中匿名性與可解讀性之間的摩擦相對(duì)來(lái)說(shuō)還比較小。一個(gè) 區(qū)塊鏈數(shù)據(jù)集的匿名性越高,從中獲取有意義的信息的難度就越大。參與 者的身份提供了其行為的上下文環(huán)境,而上下文環(huán)境則是可解讀性的關(guān)鍵構(gòu)建模塊。

[[284178]]

去匿名化 vs. 打標(biāo)簽

你是什么遠(yuǎn)比你是誰(shuí)要重要。

去匿名化區(qū)塊鏈數(shù)據(jù)集并不涉及了解每個(gè)參與者的真實(shí)身份。試圖了解每個(gè) 用戶的真實(shí)身份不僅是一個(gè)意義重大的任務(wù),而且也會(huì)讓分析工作難以突破 一定的規(guī)模。相反,我們可以試著理解一個(gè)參與者的關(guān)鍵特征來(lái)讓我們的分析 達(dá)到一定程度的可解讀性。因此,不需要清楚地識(shí)別每個(gè)地址的真實(shí)身份,我們 可以給地址打標(biāo)簽或者附加一些描述性的元數(shù)據(jù),來(lái)讓其行為具備一定的 上下文環(huán)境。

在大規(guī)模數(shù)據(jù)中,打標(biāo)簽常常要比個(gè)體識(shí)別更有效果。理解區(qū)塊鏈生態(tài)系統(tǒng) 中特定個(gè)體的行為當(dāng)然會(huì)讓分析達(dá)到更個(gè)性化的程度,但是對(duì)于在宏觀層面 理解行為的趨勢(shì)就顯得相對(duì)受限了。

 

 

因此,相對(duì)與對(duì)區(qū)塊鏈地址的個(gè)體真實(shí)身份的識(shí)別,去匿名性的挑戰(zhàn)與地址 的關(guān)鍵性屬性的標(biāo)注的關(guān)系更大。我們?nèi)绾螌?shí)現(xiàn)這一點(diǎn)?

機(jī)器學(xué)習(xí)是解藥

標(biāo)注或者去匿名化區(qū)塊鏈的思路可以讓區(qū)塊鏈分析更好地生態(tài)中已知參與者 的行為模式和特征。直覺上我們可以考慮創(chuàng)建一些規(guī)則來(lái)分析區(qū)塊鏈生態(tài)系統(tǒng) 中的不同成員,例如:

如果一個(gè)地址持有大量比特幣地址并且一次執(zhí)行100個(gè)交易,那么這是一個(gè)交易所地址...

雖然很有吸引力,但是基于規(guī)則的方法將很快失效,無(wú)法再提供有用的信息。 下面列出了部分原因:

  1. 預(yù)置知識(shí)的完整性:基于規(guī)則的分類會(huì)假定我們對(duì)于如何識(shí)別區(qū)塊鏈生態(tài)中的 不同參與者有足夠的知識(shí)。這顯然是不正確的假設(shè)。
  2. 持續(xù)的變化:區(qū)塊鏈解決方案的架構(gòu)一直都在演變,這對(duì)任何嵌入的規(guī)則而言都是挑戰(zhàn)。
  3. 特征屬性的數(shù)量:創(chuàng)建一條有兩三個(gè)參數(shù)的規(guī)則很簡(jiǎn)單,但是試圖創(chuàng)建一條有幾十個(gè) 甚至上百個(gè)參數(shù)的規(guī)則就沒那么簡(jiǎn)單了。要識(shí)別出像交易所或OTC柜臺(tái)這樣的 地址需要大量的特征。

因此我們不能使用預(yù)置的規(guī)則,我們需要一種可以從區(qū)塊鏈數(shù)據(jù)集中學(xué)習(xí)模式的機(jī)制 來(lái)自動(dòng)推斷出有意義的規(guī)則讓我們可以標(biāo)注相關(guān)的參與方。從概念上來(lái)說(shuō),這是一個(gè) 經(jīng)典的機(jī)器學(xué)習(xí)問題。

從機(jī)器學(xué)習(xí)的觀點(diǎn),我們應(yīng)該從兩個(gè)主要途徑來(lái)考慮應(yīng)對(duì)去匿名化的挑戰(zhàn):

  • 無(wú)監(jiān)督學(xué)習(xí):無(wú)監(jiān)督學(xué)習(xí)聚焦于學(xué)習(xí)指定數(shù)據(jù)集中存在的模式并識(shí)別相關(guān)分組。在 區(qū)塊鏈數(shù)據(jù)集的上下文中,可以使用無(wú)監(jiān)督學(xué)習(xí)模型基于地址的特征將其匹配到 不同的分組中并對(duì)這些分組進(jìn)行標(biāo)注。
  • 監(jiān)督學(xué)習(xí):監(jiān)督學(xué)習(xí)方法可以利用已有的知識(shí)來(lái)學(xué)習(xí)指定數(shù)據(jù)集中的新的特性。 在區(qū)塊鏈上下文中,可以使用監(jiān)督學(xué)習(xí)方法基于已有的交易所地址數(shù)據(jù)集訓(xùn)練一個(gè) 模型來(lái)識(shí)別出新的交易所地址。

去匿名化或者給區(qū)塊鏈數(shù)據(jù)集打標(biāo)簽很少是只用監(jiān)督學(xué)習(xí)或者只用非監(jiān)督學(xué)習(xí), 更多的情況下需要兩種方法的結(jié)合。機(jī)器學(xué)習(xí)模型可以有效地學(xué)習(xí)區(qū)塊鏈生態(tài) 系統(tǒng)中特定參與者的特征,并利用這些特征來(lái)理解其行為。

在使用區(qū)塊鏈ETL工具將區(qū)塊鏈 原始數(shù)據(jù)加載到數(shù)據(jù)庫(kù)或大數(shù)據(jù)分析平臺(tái)后,將標(biāo)注層引入?yún)^(qū)塊鏈數(shù)據(jù)集是進(jìn)行更有 價(jià)值的區(qū)塊鏈數(shù)據(jù)分析的一個(gè)關(guān)鍵挑戰(zhàn)。這些標(biāo)簽提供了更好的上下文環(huán)境,也讓區(qū) 塊鏈分析模型具有更好的可解讀性。不過(guò)盡管我們有機(jī)器學(xué)習(xí)這樣強(qiáng)大的工具,去匿 名性依然是分析理解區(qū)塊鏈生態(tài)系統(tǒng)的道路上一個(gè)不可忽視的重大路障。

 

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2022-05-19 19:26:33

區(qū)塊鏈大數(shù)據(jù)數(shù)據(jù)分析

2022-06-01 11:56:04

區(qū)塊鏈數(shù)據(jù)分析

2022-09-21 15:14:09

區(qū)塊鏈安全攻擊

2021-05-28 11:54:41

區(qū)塊鏈數(shù)據(jù)分析密碼學(xué)角度

2022-03-25 13:39:40

區(qū)塊鏈技術(shù)房地產(chǎn)

2016-12-22 09:52:13

Hadoop大數(shù)據(jù)分析

2019-10-14 15:57:36

數(shù)據(jù)分析多維度二八法

2017-03-07 12:05:32

大數(shù)據(jù)區(qū)塊鏈分析

2021-12-02 14:25:06

區(qū)塊鏈加密貨幣技術(shù)

2020-10-21 10:51:43

數(shù)據(jù)分析

2020-05-06 10:59:18

區(qū)塊鏈分布式比特幣

2024-02-22 11:23:16

2018-11-22 12:50:41

區(qū)塊鏈比特幣數(shù)字貨幣

2018-08-27 08:07:47

2021-05-27 18:08:22

區(qū)塊鏈物聯(lián)網(wǎng)大數(shù)據(jù)

2018-08-27 16:35:15

2018-03-20 13:32:22

數(shù)據(jù)分析IT企業(yè)數(shù)據(jù)存儲(chǔ)

2018-09-06 18:29:39

2022-10-12 00:13:20

數(shù)據(jù)分析人工智能數(shù)據(jù)可視化

2022-02-18 14:27:17

區(qū)塊鏈安全技術(shù)
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)