自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何利用機(jī)器學(xué)習(xí)識別加密項目風(fēng)險?

人工智能 機(jī)器學(xué)習(xí) 區(qū)塊鏈
加密貨幣是一種存在于數(shù)字世界的交易媒介(另一種支付形式),依靠加密技術(shù)使交易安全。加密貨幣背后的技術(shù)允許用戶直接向他人發(fā)送貨幣,而不需要通過第三方,如銀行。

 加密貨幣和監(jiān)管的必要性

加密貨幣是一種存在于數(shù)字世界的交易媒介(另一種支付形式),依靠加密技術(shù)使交易安全。加密貨幣背后的技術(shù)允許用戶直接向他人發(fā)送貨幣,而不需要通過第三方,如銀行。為了進(jìn)行這些交易,用戶需要設(shè)置一個數(shù)字錢包,而不需要提供身份證號碼或信用評分等個人細(xì)節(jié),因此可以讓用戶偽匿名。

對于普通的加密貨幣用戶來說,這種匿名性可以讓他們放心,因為他們的個人信息或交易數(shù)據(jù)不會被黑客竊取。然而,這種交易匿名性的提高,也容易被犯罪分子濫用,進(jìn)行洗錢、恐怖融資等非法活動。這種非法活動給區(qū)塊鏈錢包用戶以及加密貨幣實體都造成了巨大的損失。雖然金融行動特別工作組(FATF)等監(jiān)管機(jī)構(gòu)已經(jīng)在這些實體的監(jiān)管中引入了標(biāo)準(zhǔn)化的指導(dǎo)方針,但由于每天都有大量的加密貨幣實體和交易發(fā)生,監(jiān)控加密貨幣空間是一項具有挑戰(zhàn)性的任務(wù)。

解決方案

 

[[377572]]

 

因此,人們有興趣利用開源信息,例如新聞網(wǎng)站或社交媒體平臺,來識別可能的安全漏洞或非法活動。在與Lynx Analytics的合作中,我們(來自新加坡國立大學(xué)的一個學(xué)生團(tuán)隊)已經(jīng)致力于開發(fā)一個自動工具,以刮取開源信息,預(yù)測每篇新聞文章的風(fēng)險分?jǐn)?shù),并標(biāo)記出風(fēng)險文章。這個工具將被整合到Cylynx平臺(https://www.cylynx.io/)中,這是Lynx Analytics開發(fā)的一個工具,用于幫助監(jiān)管機(jī)構(gòu)通過使用各種信息源監(jiān)控區(qū)塊鏈活動。

開源信息的數(shù)據(jù)獲取

我們確定了3類開源數(shù)據(jù),這些數(shù)據(jù)可以提供有價值的信息,幫助檢測加密貨幣領(lǐng)域的可疑活動。這些類別是:

  1. 傳統(tǒng)的新聞網(wǎng)站,如谷歌新聞,它將報告重大的黑客事件。
  2. 加密貨幣專用新聞網(wǎng)站,如Cryptonews和Cointelegraph,它們更有可能報道小型實體和小型安全事件的新聞。
  3. 社交媒體網(wǎng)站,如Twitter和Reddit,在官方發(fā)布黑客新聞之前,加密貨幣所有者可能會在那里發(fā)布有關(guān)黑客的消息。

 

硬核丨如何利用機(jī)器學(xué)習(xí)識別加密項目風(fēng)險?

 

檢索文章和社交媒體帖子的內(nèi)容,然后建立情緒分析模型。該模型為文章中提到的實體分配了一個風(fēng)險活動的概率。

情緒分析模型

我們嘗試了四種不同的自然語言處理工具進(jìn)行情緒分析,即VADER、Word2Vec、fastText和BERT模型。在通過選定的關(guān)鍵指標(biāo)(召回率、精度和F1)對這些模型進(jìn)行評估后,RoBERTa模型(BERT的一個變種)表現(xiàn)最佳,被選為最終模型。

 

硬核丨如何利用機(jī)器學(xué)習(xí)識別加密項目風(fēng)險?

 

RoBERTa模型對新聞文章(標(biāo)題和摘錄)或社交媒體帖子的文本進(jìn)行處理,并為特定文本分配一個風(fēng)險分?jǐn)?shù)。由于該文本在數(shù)據(jù)收集過程中已經(jīng)被標(biāo)記為實體,我們現(xiàn)在已經(jīng)有了加密實體的相關(guān)風(fēng)險指標(biāo)。在后期,我們將多個文本的風(fēng)險分?jǐn)?shù)結(jié)合起來,給出一個實體的整體風(fēng)險分?jǐn)?shù)。

RoBERTa原本是一個使用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)建立的情感分析模型,我們將最后一層與我們標(biāo)注的風(fēng)險分?jǐn)?shù)進(jìn)行映射,以適應(yīng)風(fēng)險評分的環(huán)境。為了提高模型在未來文本數(shù)據(jù)上的通用性,我們進(jìn)行了幾種文本處理方法,即替換實體、刪除url和替換hash。然后我們使用這個表現(xiàn)最好的模型進(jìn)行風(fēng)險評分。

風(fēng)險評分

現(xiàn)在,每篇文章都有一個相關(guān)的來源(news/reddit/twitter),一個風(fēng)險概率和一個計數(shù),指的是文章被轉(zhuǎn)發(fā)、分享或轉(zhuǎn)發(fā)的次數(shù)。為了將這些風(fēng)險概率轉(zhuǎn)換為加密貨幣實體的單一風(fēng)險得分,我們首先將文章的概率值縮放到0到100的范圍內(nèi),并獲得每個來源的加權(quán)平均值,結(jié)合文章的風(fēng)險得分和計數(shù)。加權(quán)平均數(shù)用于對計數(shù)較高的文章給予更大的重視,因為份額數(shù)量很可能表明文章的相關(guān)性或重要性。

在計算出各來源的風(fēng)險得分后,我們對各來源的風(fēng)險得分進(jìn)行加權(quán)求和,得到綜合得分,公式如下:

傳統(tǒng)的新聞來源被賦予了更高的權(quán)重,因為這些來源更有可能報道重大的安全漏洞(相對于單個用戶的黑客事件)。

該解決方案的有效性

我們在2020年1月1日至2020年10月30日的174個加密貨幣實體的名單上測試了我們的解決方案,并將結(jié)果與該時間段內(nèi)的已知黑客案例進(jìn)行了比較。我們發(fā)現(xiàn),我們的風(fēng)險評分方法表現(xiàn)相當(dāng)出色,在37個已知的黑客案例中識別了32個。我們還分析了我們的解決方案對單個實體的有效性。下圖顯示了Binance從2020年1月1日至2020年10月30日的風(fēng)險評分。虛線紅線代表已知的黑客案例。從圖中我們觀察到,我們的解決方案報告了5個已知黑客中的4個黑客的風(fēng)險得分增加。也有幾個峰值與已知黑客案例不一致。然而,這并不構(gòu)成一個主要問題,因為對我們的模型來說,更重要的是識別盡可能多的黑客,減少未識別的黑客數(shù)量。

 

硬核丨如何利用機(jī)器學(xué)習(xí)識別加密項目風(fēng)險?

 

有趣的發(fā)現(xiàn)

在風(fēng)險評分過程中,我們注意到,與規(guī)模較小的實體相比,規(guī)模較大的實體的風(fēng)險評分往往有較大比例的假陽性記錄。這是因為大型實體被談?wù)摰酶?,因此會有更多的?fù)面帖子和虛假謠言,從而導(dǎo)致更高的不準(zhǔn)確率。

另一個值得強(qiáng)調(diào)的有趣趨勢是,圍繞著黑客攻擊通常有幾個明顯的高峰。這是由于不同數(shù)據(jù)源的反應(yīng)時間不同。社交媒體網(wǎng)站Twitter和Reddit通常是第一個看到高風(fēng)險事件發(fā)生時的高峰,因為用戶會發(fā)帖提出他們觀察到的異常情況,比如一個實體的網(wǎng)站在沒有事先通知用戶的情況下宕機(jī)。官方消息一般是在官方聲明之后,稍后才會發(fā)布。

局限性

我們發(fā)現(xiàn),我們的解決方案有兩個潛在的局限性,首先是需要不斷地維護(hù)收集器。網(wǎng)站設(shè)計可能會隨著時間的推移而改變,這些網(wǎng)站的刮擦器需要更新,以確保相關(guān)信息仍能被檢索到,從而達(dá)到風(fēng)險評分的目的。

第二個限制是,驗證一篇文章是否已被正確地標(biāo)記為加密貨幣實體是具有挑戰(zhàn)性的。例如,一篇報道Bancor可疑活動的文章可能也會因為一個不相關(guān)的事件提到Binance。我們的解決方案會錯誤地將新聞標(biāo)記為兩個實體,并將Binance標(biāo)記為風(fēng)險,即使它不是文本中的關(guān)鍵主題。然而,這并不是一個主要的限制,因為我們只使用新聞文章的標(biāo)題和摘錄來進(jìn)行風(fēng)險評分,這通常只包含文章的關(guān)鍵信息。

結(jié)語

 

硬核丨如何利用機(jī)器學(xué)習(xí)識別加密項目風(fēng)險?

 

我們的項目讓監(jiān)管機(jī)構(gòu)可以輕松挖掘開源信息,更好地識別加密貨幣領(lǐng)域發(fā)生的風(fēng)險事件。我們提供了一個分析文章并預(yù)測風(fēng)險分?jǐn)?shù)的語言模型,以及根據(jù)實體和來源信息匯總這些分?jǐn)?shù)的方法。這些方法都被編織成一個可以端到端運(yùn)行的自動化流水線。將該項目整合到Cylynx平臺中,將對其現(xiàn)有功能進(jìn)行補(bǔ)充,并為監(jiān)管機(jī)構(gòu)識別高風(fēng)險加密貨幣實體提供巨大的幫助。

責(zé)任編輯:華軒 來源: 今日頭條
相關(guān)推薦

2010-07-06 10:35:59

2021-04-08 15:15:47

加密貨幣銀行金融

2011-08-09 09:37:57

風(fēng)險管理策略

2020-12-25 15:24:24

人工智能

2021-06-17 10:27:03

人工智能AI機(jī)器學(xué)習(xí)

2022-06-02 15:42:05

Python機(jī)器學(xué)習(xí)

2020-12-22 09:58:45

機(jī)器學(xué)習(xí)工業(yè)運(yùn)營工業(yè)傳感器

2016-04-11 14:35:59

機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘數(shù)據(jù)模型

2016-08-31 06:55:45

機(jī)器學(xué)習(xí)標(biāo)題誘餌

2022-05-17 12:25:59

物聯(lián)網(wǎng)智能建筑樓宇自控

2017-05-02 09:02:14

2016-09-26 20:52:35

2018-11-15 09:00:00

機(jī)器學(xué)習(xí)人工智能數(shù)據(jù)中心

2019-12-16 14:53:44

機(jī)器學(xué)習(xí)人工智能計算機(jī)

2017-01-10 13:42:18

大數(shù)據(jù)深度學(xué)習(xí)識別圖片

2024-04-17 08:00:00

2022-08-04 09:00:00

機(jī)器學(xué)習(xí)藥物開發(fā)Pytorch

2017-11-16 09:58:43

機(jī)器學(xué)習(xí)大數(shù)據(jù)技術(shù)算法

2010-05-24 15:36:16

2017-09-15 18:13:57

機(jī)器學(xué)習(xí)深度學(xué)習(xí)語音識別
點贊
收藏

51CTO技術(shù)棧公眾號