在近日51CTO主辦的MetaCon元宇宙技術大會上,歐科云鏈區(qū)塊鏈資深研究員許乾帶來了主題演講《區(qū)塊鏈大數(shù)據(jù)的探索與應用》,分享了他對行業(yè)的最新觀點和思考。
許乾認為,區(qū)塊鏈大數(shù)據(jù)的發(fā)展進入到需求迸發(fā)的階段,區(qū)塊鏈與元宇宙的結合,促使區(qū)塊鏈大數(shù)據(jù)公司需要接納更多的交互內容。此外,許乾還介紹了區(qū)塊鏈大數(shù)據(jù)具體的落地應用情況。
本文對許乾演講的精彩內容進行了整理,希望能夠對大家有所幫助。
歐科云鏈是全球領先的區(qū)塊鏈企業(yè),成立于2013年,也是中國本土成立時間最早的區(qū)塊鏈企業(yè)之一。公司致力于區(qū)塊鏈技術的研發(fā)與商用,現(xiàn)已發(fā)展成全球化的大型區(qū)塊鏈技術與服務提供商,旗下產品OKLink提供精準的鏈上數(shù)據(jù)分析解決方案。今天我們重點講解一下區(qū)塊鏈大數(shù)據(jù)的發(fā)展歷程。
區(qū)塊鏈大數(shù)據(jù)的發(fā)展:數(shù)據(jù)激增、需求迸發(fā)
從公司層面來看,區(qū)塊鏈大數(shù)據(jù)業(yè)務的發(fā)展有四個重要的時間節(jié)點。2019年8月,歐科云鏈開始布局公有鏈的區(qū)塊鏈瀏覽器的相關業(yè)務,包括區(qū)塊解析、交易解析、地址詳情;2020年4月,開始開展多維度鏈上數(shù)據(jù)統(tǒng)計業(yè)務,包括富豪地址、算力分析、實體標簽;2020年9月,推出了鏈上天眼與鏈上大師的產品雛形,包括鏈上監(jiān)控、圖譜分析、智能合約解析;2021年7月,歐科云鏈從整鏈數(shù)據(jù)轉到業(yè)務層數(shù)據(jù),由區(qū)塊鏈基礎設施服務逐步轉向區(qū)塊鏈鏈上數(shù)據(jù)治理。
從數(shù)據(jù)量級來看,目前歐科云鏈已經支持10條以上公鏈的全節(jié)點解析,而且是全量解析;ES、Hbase、圖庫、數(shù)倉等數(shù)據(jù)庫共有超過100TB數(shù)據(jù);純粹鏈上的交易數(shù)據(jù)167億條;地址維度15億條;地址標簽數(shù)據(jù)超過1億條。
需要指出的是,區(qū)塊鏈大數(shù)據(jù)主要有以下四大特點:
1、巨大的數(shù)據(jù)量
從上述的數(shù)據(jù)中可以看出,該業(yè)務的數(shù)據(jù)量非常龐大。集中儲存、集中計算已經無法處理巨大的數(shù)據(jù)量。
2、多結構化數(shù)據(jù)
自從元宇宙火爆之后,區(qū)塊鏈與元宇宙的結合,促使區(qū)塊鏈大數(shù)據(jù)公司需要接納關于圖片、視頻和各類文檔的交互,超出了傳統(tǒng)的數(shù)據(jù)認知范圍。
3、增長速度很快
目前以以太坊為首的EVM公鏈擴充之后,新的公鏈的速度都非??欤鎯Φ臄?shù)據(jù)量也會非常大。海量數(shù)據(jù)需要及時有效分析,用戶基數(shù)龐大,設備數(shù)量眾多,實時海量,數(shù)據(jù)指數(shù)級別增長,這需要我們進行整體的重構。
4、價值密度低
單條數(shù)據(jù)其實并無太多價值,但龐大的數(shù)據(jù)量卻蘊含著巨大財富。如果現(xiàn)在想把元宇宙的業(yè)務信息對外展示,就需要擁有更深入的數(shù)據(jù)解析、挖掘和分析能力。此時區(qū)塊鏈數(shù)據(jù)的開采難度和成本還是非常高的。
上圖是行業(yè)中的一些頭部公司的融資情況。在去年鏈上數(shù)據(jù)迸發(fā)時,都已經完成千萬級別美元的融資,整體估值已經上億。這表明整個賽道去年被VC所關注,進入到需求迸發(fā)的階段。
下面舉一個例子,以標簽業(yè)務的發(fā)展和思考,以點帶面地講述大數(shù)據(jù)行業(yè)的發(fā)展。
我們對標簽進行了分級:一級標簽是行業(yè)、領域的分類;二級標簽是單位、機構組織等具體名稱;三級標簽是具體地址類別。
自2020年末伊始,基于智能合約體系的業(yè)務發(fā)展,呈現(xiàn)出爆發(fā)的態(tài)勢。大量的金融創(chuàng)新都在區(qū)塊鏈的體系之上進行運轉,包括銀行類、交易類的業(yè)務,以及金融衍生品的業(yè)務。這些業(yè)務的發(fā)展也具備了分析的價值。
比如現(xiàn)在有一個地址,能夠通過跟蹤它去發(fā)現(xiàn)能夠盈利的信息,這個地址的最終分析哪怕關注不到某一個人,也是非常有價值的。因為只要跟著它進行操作,你就可以賺到錢,至于這個人到底是誰,你已經不關注了。
這類標簽就是比較著名Smart Money。Smart Money翻譯過來稱作聰錢。跟著聰明的錢,你去投資相同的東西,關注它的進出,大概率你也可以獲得不錯的收益。在傳統(tǒng)市場里面,針對聰錢的分析,都是非常稀有的信息,需要有自己的分析師、甚至是一套系統(tǒng)才能進行分析。但是得益于區(qū)塊鏈鏈上公開信息的設計,只要你有數(shù)據(jù)的存儲、分析能力,就可以用更低廉的成本去挖掘。
另一個備受關注的標簽是消息靈通者。比如某個地址在幾天前購入了某項資產,此后該資產受事件影響出現(xiàn)非常大的漲幅。類似這樣的事件偶然發(fā)生幾次之后,我們就可以給這個地址打上“消息靈通者”的標簽,證明其可能會先于市場知道會漲的消息。雖然不知道它是誰,但是從鏈上的行為來看,它都做出了盈利的結果。這類標簽被定義為行為標簽,而不是實體標簽的概念。
還有一類標簽叫做屬性標簽,基于地址的鏈上屬性(智能合約代碼,創(chuàng)建時間,創(chuàng)建者等)分析生產的標簽,用于描述地址本身的特性,比如黑客攻擊事件。如何防范,提前預知攻擊也是我們需要思考的領域,此時我們就必然會關注到智能合約源碼。我們發(fā)現(xiàn)一些頭部的項目都會公開他們自己的合約代碼,當然也有很多反編譯的手段,讓一些代碼有反編譯的效果。然后我們會順著代碼去做分析,比如找出一些高危的函數(shù),或者是高危的編碼特征,運用智能合約標上它是特權函數(shù)或是特權地址的屬性。擁有特權函數(shù)地址的屬性,可能就會產生高危的風險。這些本質上是針對鏈上的智能合約源碼,針對鏈上屬性去做補充的。這類是屬性標簽。
目前打標簽主要有三種方式。一是人工收錄,比如針對暗網(wǎng)地址的收錄,會有人工收集的過程;二是模型擴展,根據(jù)鏈上的行為特征去歸納總結出擴展方式,并把擴展方式交給指定的輸入員,再根據(jù)鏈上數(shù)據(jù)的解析,他可以完成動態(tài)擴充;三是人工智能,利用機器學習去動態(tài)創(chuàng)建特征工程,然后按照算法自動尋找潛在的標簽。
歐科云鏈的探索:洞悉鏈上數(shù)據(jù) 守護鏈上安全
針對大數(shù)據(jù)的應用,我們也進行了許多探索。
首先是鏈上天眼。地圖上的數(shù)字就是真實發(fā)生在國內的數(shù)字貨幣案件的數(shù)量,顏色越深的地方,安全等級越高。從圖中可以看出案件的分布情況和涉案金額。
目前,全球區(qū)塊鏈資產犯罪非常嚴重,詐騙是主要的犯罪形式,其次盜竊、傳銷和洗錢。具體來看,2021年全球區(qū)塊鏈資產犯罪的涉案金額高達140億美元,同比增長79%;區(qū)塊鏈資產詐騙案件造成損失78億美元,同比增長82%;黑客盜竊案件造成損失32億美元,同比增長516%;DeFi犯罪損失超120億美元,同比增長6倍。相關的涉案金額其實是非常驚人的。
與此同時,我國的執(zhí)法部門在區(qū)塊鏈資產犯罪案件的取證分析過程中也遇到了技術瓶頸:一是區(qū)塊鏈資產種類多、交易量大,24小時不間斷交易,抓取和分析的工作量大;二是區(qū)塊鏈資產交易 APP、PC 應用種類多,取證和調證凍結難;三是轉賬鏈路復雜,鏈上身份與現(xiàn)實身份無法對應;四是區(qū)塊鏈項目代碼質量參差不齊,漏洞較多,常被黑客和具有惡意的內部人員輕易利用;五是扣押的區(qū)塊鏈資產無法合規(guī)托管、處置。
因此,基于前述的關于標簽的建設,以及全量數(shù)據(jù)的統(tǒng)計、搜集和計算能力,我們推出了一款針對鏈上資產追蹤的產品——鏈上天眼。
通過鏈上天眼,可以全方位展示某一鏈上地址的生命周期行為及其特點,通過地址研判,自主查詢資產的走向和鏈路,確定資產的來源流向;通過數(shù)據(jù)挖掘對比,對非標簽化數(shù)據(jù)進行二次碰撞,找到涉案地址與潛在特定關聯(lián)人員地址,以點帶面;通過大數(shù)據(jù)可視化形式,實時展現(xiàn)全國各地數(shù)字資產案件的總覽情況。
對于像博彩平臺、虛假交易所、釣魚網(wǎng)站等常見類型的案件,結合在上百起案件中所積累的分析研判經驗,通過對技戰(zhàn)法的專業(yè)建模,實現(xiàn)了對平臺地址結構的自動化挖掘,以點帶面,進而找到平臺資產的流轉情況、沉淀資產的藏匿之處。同時,根據(jù)所挖掘出來的充提幣地址以及平臺的大地址,快速掌握對應平臺的涉案人數(shù)以及案件金額等情況。
接下來再簡單介紹一下鏈上大師的業(yè)務。結合OKLink蜂巢架構的核心底層技術,基于插拔式架構的擴展,利用OLAP數(shù)據(jù)庫進行離線+實時分析,使用預計算方案,滿足鏈上數(shù)據(jù)全方位的多維度指標輸出。鏈上大師能提供以下功能:一是數(shù)據(jù)監(jiān)控,第一時間獲悉數(shù)據(jù)異動,及時掌握市場變化;二是借助組合式工具包,用戶可進行多組數(shù)據(jù)復合對比分析,DIY指標和數(shù)據(jù)看板;三是導航+搜索+篩選,方便快捷查找所需數(shù)據(jù)指標、精準定位時間周期;四是自定義看板,將個人常用指標添加收藏、方便查看,滿足用戶的差異化需求。
以上就是我對區(qū)塊鏈大數(shù)據(jù)的思考和探索,希望能對大家有所幫助!謝謝!
在本次MetaCon元宇宙技術大會上,還有很多專家學者也做了相關主題演講,點擊進入??官網(wǎng)??,了解更多元宇宙技術精彩內容!