自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

大數(shù)據(jù)和區(qū)塊鏈之間的比較分析

大數(shù)據(jù)
數(shù)據(jù)和區(qū)塊鏈兩者之間有個(gè)共同的關(guān)鍵詞:分布式,代表了一種從技術(shù)權(quán)威壟斷到去中心化的轉(zhuǎn)變。

大數(shù)據(jù)和區(qū)塊鏈兩者之間有個(gè)共同的關(guān)鍵詞:分布式,代表了一種從技術(shù)權(quán)威壟斷到去中心化的轉(zhuǎn)變。

[[184820]]

分布式存儲(chǔ):HDFS vs. 區(qū)塊

大數(shù)據(jù),需要應(yīng)對(duì)海量化和快增長(zhǎng)的存儲(chǔ),這要求底層硬件架構(gòu)和文件系統(tǒng)在性價(jià)比上要大大高于傳統(tǒng)技術(shù),能夠彈性擴(kuò)張存儲(chǔ)容量。谷歌的GFS和Hadoop的HDFS奠定了大數(shù)據(jù)存儲(chǔ)技術(shù)的基礎(chǔ)。另外,大數(shù)據(jù)對(duì)存儲(chǔ)技術(shù)提出的另一個(gè)挑戰(zhàn)是多種數(shù)據(jù)格式的適應(yīng)能力,因此現(xiàn)在大數(shù)據(jù)底層的存儲(chǔ)層不只是HDFS,還有HBase和Kudu等存儲(chǔ)架構(gòu)。

區(qū)塊鏈,是比特幣的底層技術(shù)架構(gòu),它在本質(zhì)上是一種去中心化的分布式賬本。區(qū)塊鏈技術(shù)作為一種持續(xù)增長(zhǎng)的、按序整理成區(qū)塊的鏈?zhǔn)綌?shù)據(jù)結(jié)構(gòu),通過(guò)網(wǎng)絡(luò)中多個(gè)節(jié)點(diǎn)共同參與數(shù)據(jù)的計(jì)算和記錄,并且互相驗(yàn)證其信息的有效性。從這一點(diǎn)來(lái)說(shuō),區(qū)塊鏈技術(shù)也是一種特定的數(shù)據(jù)庫(kù)技術(shù)。由于去中心化數(shù)據(jù)庫(kù)在安全、便捷方面的特性,很多業(yè)內(nèi)人士看好其發(fā)展,認(rèn)為它是對(duì)現(xiàn)有互聯(lián)網(wǎng)技術(shù)的升級(jí)與補(bǔ)充。

分布式計(jì)算:MapReduce vs. 共識(shí)機(jī)制

大數(shù)據(jù)的分析挖掘是數(shù)據(jù)密集型計(jì)算,需要巨大的分布式計(jì)算能力。節(jié)點(diǎn)管理、任務(wù)調(diào)度、容錯(cuò)和高可靠性是關(guān)鍵技術(shù)。Google和Hadoop的MapReduce是這種分布式計(jì)算技術(shù)的代表,通過(guò)添加服務(wù)器節(jié)點(diǎn)可線性擴(kuò)展系統(tǒng)的總處理能力(Scale Out),在成本和可擴(kuò)展性上都有巨大的優(yōu)勢(shì)?,F(xiàn)在,除了批計(jì)算,大數(shù)據(jù)還包括了流計(jì)算、圖計(jì)算、實(shí)時(shí)計(jì)算、交互查詢等計(jì)算框架。

區(qū)塊鏈的共識(shí)機(jī)制,就是所有分布式節(jié)之間怎么達(dá)成共識(shí),通過(guò)算法來(lái)生成和更新數(shù)據(jù),去認(rèn)定一個(gè)記錄的有效性,這既是認(rèn)定的手段,也是防止篡改的手段。區(qū)塊鏈主要包括四種不同的共識(shí)機(jī)制,適用于不同的應(yīng)用場(chǎng)景,在效率和安全性之間取得平衡。以比特幣為例,采用的是“工作量證明”(Proof Of Work,簡(jiǎn)稱POW),只有在控制了全網(wǎng)超過(guò)51%的記賬節(jié)點(diǎn)的情況下,才有可能偽造出一條不存在的記錄。

IT技術(shù)發(fā)展的分分合合

和人類社會(huì)一樣,IT技術(shù)發(fā)展的也呈現(xiàn)出“合久必分,分久必合”,即集中與分布的螺旋式上升。

計(jì)算機(jī)誕生初期,僅能實(shí)現(xiàn)一對(duì)一的使用,是集中化的。為了使得一臺(tái)大型機(jī)能夠同時(shí)為多個(gè)客戶提供服務(wù),IBM公司引入了虛擬化的設(shè)計(jì)思想,使得多個(gè)客戶在同時(shí)使用同一臺(tái)大型機(jī)時(shí),就好像將其分割成了多個(gè)小型化的虛擬主機(jī),是時(shí)分復(fù)用的集中式計(jì)算。

進(jìn)入小型機(jī)和PC時(shí)代,回歸了一對(duì)一的使用,不過(guò)設(shè)備已經(jīng)分散到了千家萬(wàn)戶。進(jìn)入互聯(lián)網(wǎng)時(shí)代,C/S模型的客戶端和服務(wù)器是分布式計(jì)算,只不過(guò)服務(wù)器之間還是分散的。

進(jìn)入云計(jì)算時(shí)代,計(jì)算能力又被統(tǒng)一管控起來(lái),在客戶端和服務(wù)器的分布式計(jì)算基礎(chǔ)之上,服務(wù)器之間也開(kāi)始了分布式協(xié)同工作。因?yàn)閰f(xié)同,所以也可以認(rèn)為它們?cè)谡w上是一種集中式的計(jì)算服務(wù)。

進(jìn)入大數(shù)據(jù)時(shí)代,云計(jì)算成為大數(shù)據(jù)基礎(chǔ)設(shè)施,也使得大數(shù)據(jù)的核心思想和云計(jì)算一脈相承。MapReduce將任務(wù)分解進(jìn)行分布式計(jì)算,然后將結(jié)果合并從而實(shí)現(xiàn)了信息的整合分析。

區(qū)塊鏈則是純粹意義上的分布式系統(tǒng)。

是什么力量造成了集中與分布的此消彼長(zhǎng)?

讓我們從歷史中試著尋找答案。

商業(yè)需要集中,希望通過(guò)產(chǎn)品實(shí)現(xiàn)更好的控制和更高的利潤(rùn)。但隨著產(chǎn)品集中度的不斷上升,系統(tǒng)會(huì)越來(lái)越復(fù)雜,實(shí)現(xiàn)的難度越來(lái)越大,溝通、交流和管理的成本也越來(lái)越高,最終變得不經(jīng)濟(jì)。

社會(huì)需要分工,讓專業(yè)的人做專業(yè)的事,涂爾干的《社會(huì)分工論》談到,“分工使社會(huì)像有機(jī)體一樣,每個(gè)成員都為社會(huì)整體服務(wù),同時(shí)又不能脫離整體,分工就像社會(huì)的紐帶,故謂之‘有機(jī)團(tuán)結(jié)’。”

分布式技術(shù)的誕生,正是基于這種思想。產(chǎn)品功能被分解并分布到不同的節(jié)點(diǎn)上去完成,節(jié)點(diǎn)之間通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)溝通。分布式系統(tǒng)中的一些節(jié)點(diǎn)或因?yàn)樯虡I(yè)上的成功,重新成為“集中化”的節(jié)點(diǎn),但隨著時(shí)代的改變,它們終將會(huì)進(jìn)入新一輪的分布式周期。如此往復(fù)。

集中和分布不是光譜的兩端,任何偉大的產(chǎn)品,都是商業(yè)和技術(shù)的“有機(jī)團(tuán)結(jié)”。

以上是區(qū)塊鏈與大數(shù)據(jù)之間的一些相同點(diǎn),接下來(lái)聊一聊兩者之間的不同點(diǎn)。

兩者屬于不同的時(shí)代,區(qū)塊鏈繼大數(shù)據(jù)之后的又一次技術(shù)革命。

兩個(gè)技術(shù)處于不同的生命周期

——Gartner Hype Cycle

技術(shù)成熟度曲線(The Hype Cycle)是咨詢公司Gartner用來(lái)分析和預(yù)測(cè)各種新科技的成熟演變速度及所需時(shí)間著名工具。

 


“大數(shù)據(jù)”與“區(qū)塊鏈”在Gartner歷年的《技術(shù)成熟度曲線》中的出現(xiàn)情況

2011年,“大數(shù)據(jù)”第一次上榜,位于技術(shù)萌芽期的爬坡階段,當(dāng)時(shí)還統(tǒng)稱為“‘Big Data’ and Extreme Information Processing and Management”(“大數(shù)據(jù)”和極端信息處理和管理)。2012年更進(jìn)一步,并在2013年幾乎達(dá)到了過(guò)熱期頂峰。經(jīng)歷了2014年的下滑,從2015年開(kāi)始,“大數(shù)據(jù)”突然從曲線中消失,可解讀為Gartner對(duì)大數(shù)據(jù)的定位已從“新興”轉(zhuǎn)為“主流”。當(dāng)前,大數(shù)據(jù)對(duì)于企業(yè)的意義已從能力要素上升為戰(zhàn)略核心。

相對(duì)而言,“區(qū)塊鏈”直到2016年才第一次出現(xiàn)在《技術(shù)成熟度曲線》中,并直接進(jìn)入“過(guò)熱期”??偟膩?lái)看,“大數(shù)據(jù)”和“區(qū)塊鏈”所處的生命周期階段大不相同,兩者約有5年左右的差距。

主要差異在哪?

大數(shù)據(jù)通常用來(lái)描述數(shù)據(jù)集足夠大,足夠復(fù)雜,以致很難用傳統(tǒng)的方式來(lái)處理。而區(qū)塊鏈能承載的信息數(shù)據(jù)是有限的,離“大數(shù)據(jù)”標(biāo)準(zhǔn)還差得很遠(yuǎn)。區(qū)塊鏈與大數(shù)據(jù)有幾個(gè)顯著差異:

結(jié)構(gòu)化vs非結(jié)構(gòu)化:區(qū)塊鏈?zhǔn)墙Y(jié)構(gòu)定義嚴(yán)謹(jǐn)?shù)膲K,通過(guò)指針組成的鏈,典型的結(jié)構(gòu)化數(shù)據(jù),而大數(shù)據(jù)需要處理的更多的是非結(jié)構(gòu)化數(shù)據(jù);

獨(dú)立vs整合:區(qū)塊鏈系統(tǒng)為保證安全性,信息是相對(duì)獨(dú)立的,而大數(shù)據(jù)著重的是信息的整合分析;

直接vs間接:區(qū)塊鏈系統(tǒng)本身就是一個(gè)數(shù)據(jù)庫(kù),而大數(shù)據(jù)指的是對(duì)數(shù)據(jù)的深度分析和挖掘,是一種間接的數(shù)據(jù);

數(shù)學(xué)vs數(shù)據(jù):區(qū)塊鏈試圖用數(shù)學(xué)說(shuō)話,區(qū)塊鏈主張“代碼即法律”,而大數(shù)據(jù)試圖用數(shù)據(jù)說(shuō)話;

匿名vs個(gè)性:區(qū)塊鏈?zhǔn)悄涿?公開(kāi)賬本,匿名擁有者,相對(duì)于傳統(tǒng)金融機(jī)構(gòu)的公開(kāi)賬號(hào),賬本保密),而大數(shù)據(jù)有意的是個(gè)性化;

差異能否調(diào)和?

對(duì)一個(gè)分布式系統(tǒng)來(lái)說(shuō),存在CAP定理(CAP theorem)又被稱作布魯爾定理(Brewer's theorem),它指出一個(gè)分布式系統(tǒng)不可能同時(shí)滿足以下三點(diǎn):

一致性(Consistence):在分布式系統(tǒng)中的所有數(shù)據(jù)備份,在同一時(shí)刻是否同樣的值。

可用性(Availability):在集群中一部分節(jié)點(diǎn)故障后,集群整體是否還能響應(yīng)客戶端的讀寫(xiě)請(qǐng)求。

分區(qū)容忍性(Partition tolerance):集群中的某些節(jié)點(diǎn)在無(wú)法聯(lián)系后,集群整體是否還能繼續(xù)進(jìn)行服務(wù)。

由于當(dāng)前的網(wǎng)絡(luò)硬件肯定會(huì)出現(xiàn)延遲丟包等問(wèn)題,所以分區(qū)容忍性是我們必須需要實(shí)現(xiàn)的。換句話說(shuō),CAP定理表明我們必須在一致性(C)和可用性(A)之間進(jìn)行權(quán)衡。

具體到區(qū)塊鏈和大數(shù)據(jù)來(lái)說(shuō),大數(shù)據(jù)是以犧牲一致性(C)來(lái)?yè)Q取可用性(A)和分區(qū)容忍性(P)的,而區(qū)塊鏈卻優(yōu)先保證了一致性(C)。

可相互借鑒之處

通過(guò)CAP定理,我們知道區(qū)塊鏈和大數(shù)據(jù)的諸多特性無(wú)法兩全,需要針對(duì)具體場(chǎng)景,在多樣化的取舍方案下設(shè)計(jì)出多樣化的系統(tǒng)。

區(qū)塊鏈+大數(shù)據(jù):在區(qū)塊鏈中使用大數(shù)據(jù)技術(shù)

區(qū)塊鏈?zhǔn)且环N不可篡改的、全歷史的分布式數(shù)據(jù)庫(kù)存儲(chǔ)技術(shù),巨大的區(qū)塊鏈數(shù)據(jù)集合包含著每一筆交易的全部歷史,隨著區(qū)塊鏈技術(shù)的應(yīng)用迅速發(fā)展,數(shù)據(jù)規(guī)模會(huì)越來(lái)越大,不同業(yè)務(wù)場(chǎng)景區(qū)塊鏈的數(shù)據(jù)融合會(huì)進(jìn)一步擴(kuò)大數(shù)據(jù)規(guī)模和豐富性。

區(qū)塊鏈以其可信任性、安全性和不可篡改性,讓更多數(shù)據(jù)被解放出來(lái),推進(jìn)數(shù)據(jù)的海量增長(zhǎng)。區(qū)塊鏈的可追溯性使得數(shù)據(jù)從采集、交易、流通,以及計(jì)算分析的每一步記錄都可以留存在區(qū)塊鏈上,使得數(shù)據(jù)的質(zhì)量獲得前所未有的強(qiáng)信任背書(shū),也保證了數(shù)據(jù)分析結(jié)果的正確性和數(shù)據(jù)挖掘的效果。

區(qū)塊鏈能夠進(jìn)一步規(guī)范數(shù)據(jù)的使用,精細(xì)化授權(quán)范圍。脫敏后的數(shù)據(jù)交易流通,則有利于突破信息孤島,建立數(shù)據(jù)橫向流通機(jī)制,形成“社會(huì)化大數(shù)據(jù)”?;趨^(qū)塊鏈的價(jià)值轉(zhuǎn)移網(wǎng)絡(luò),逐步推動(dòng)形成基于全球化的數(shù)據(jù)交易場(chǎng)景。

區(qū)塊鏈提供的是賬本的完整性,數(shù)據(jù)統(tǒng)計(jì)分析的能力較弱。大數(shù)據(jù)則具備海量數(shù)據(jù)存儲(chǔ)技術(shù)和靈活高效的分析技術(shù),極大提升區(qū)塊鏈數(shù)據(jù)的價(jià)值和使用空間。

大數(shù)據(jù)+區(qū)塊鏈:在大數(shù)據(jù)中使用區(qū)塊鏈技術(shù)

大數(shù)據(jù)的技術(shù)生態(tài)百花齊放,沒(méi)有哪個(gè)軟件能解決所有的問(wèn)題,能解決問(wèn)題也是在一個(gè)范圍內(nèi),即使是Spark、Flink等。在強(qiáng)調(diào)透明性、安全性的場(chǎng)景下,區(qū)塊鏈有其用武之地。在大數(shù)據(jù)的系統(tǒng)上使用區(qū)塊鏈技術(shù),可以使得數(shù)據(jù)不能被隨意添加、修改和刪除,當(dāng)然其時(shí)間和數(shù)據(jù)量級(jí)是有限度的。

以時(shí)間、數(shù)據(jù)量為坐標(biāo)軸,列出了目前大數(shù)據(jù)引擎大致擅長(zhǎng)處理數(shù)據(jù)的范圍,區(qū)塊鏈可在其中成為一種很好的補(bǔ)充

比如,對(duì)于存檔的歷史數(shù)據(jù),因?yàn)樗鼈兪遣荒鼙恍薷牡?,我們可以?duì)大數(shù)據(jù)作Hash處理,并加上時(shí)間戳,存在區(qū)塊鏈之上。在未來(lái)的某一時(shí)刻,當(dāng)我們需要驗(yàn)證原始數(shù)據(jù)地真實(shí)性時(shí),可以對(duì)對(duì)應(yīng)的數(shù)據(jù)做同樣的Hash處理,如果得出的答案是相同的,則說(shuō)明數(shù)據(jù)是沒(méi)有被篡改過(guò)的。或者,只對(duì)匯總數(shù)據(jù)和結(jié)果做處理,這樣,只需要處理增量數(shù)據(jù)處理,那么應(yīng)對(duì)的數(shù)據(jù)量級(jí)和吞吐量級(jí)可能是今天的區(qū)塊鏈或改善過(guò)的系統(tǒng)可以處理的。

通過(guò)把大數(shù)據(jù)與區(qū)塊鏈相結(jié)合,能讓區(qū)塊鏈中的數(shù)據(jù)更有價(jià)值,也能讓大數(shù)據(jù)的預(yù)測(cè)分析落實(shí)為行動(dòng),它們都將是數(shù)字經(jīng)濟(jì)時(shí)代的基石。

責(zé)任編輯:武曉燕 來(lái)源: 亞信數(shù)據(jù)
相關(guān)推薦

2018-09-06 18:29:39

2019-01-10 14:44:36

2018-04-02 13:56:56

大數(shù)據(jù)區(qū)塊鏈隱私

2022-05-19 19:26:33

區(qū)塊鏈大數(shù)據(jù)數(shù)據(jù)分析

2022-05-11 10:09:13

大數(shù)據(jù)區(qū)塊鏈

2019-09-19 15:16:25

區(qū)塊鏈大數(shù)據(jù)物聯(lián)網(wǎng)

2021-12-02 22:41:10

區(qū)塊鏈大數(shù)據(jù)數(shù)據(jù)安全

2022-04-29 17:04:39

區(qū)塊鏈大數(shù)據(jù)

2017-12-11 11:38:58

2022-04-07 12:02:22

區(qū)塊鏈大數(shù)據(jù)數(shù)據(jù)中心

2020-10-07 22:02:13

人工智能區(qū)塊鏈技術(shù)

2020-09-29 16:16:44

區(qū)塊鏈會(huì)替代大數(shù)據(jù)嗎?

2019-11-29 18:10:04

區(qū)塊鏈大數(shù)據(jù)機(jī)器學(xué)習(xí)

2018-04-11 10:07:09

大數(shù)據(jù)

2017-01-16 08:25:04

大數(shù)據(jù)區(qū)塊鏈信息通信

2021-01-14 12:17:52

大數(shù)據(jù)數(shù)據(jù)分析技術(shù)

2022-05-01 21:58:10

區(qū)塊鏈大數(shù)據(jù)

2018-03-23 10:57:39

大數(shù)據(jù) 區(qū)塊鏈

2019-09-24 19:21:08

區(qū)塊鏈大數(shù)據(jù)

2018-03-20 14:35:43

大數(shù)據(jù)區(qū)塊鏈分布式
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)