1分鐘了解區(qū)塊鏈的本質
區(qū)塊鏈,比特幣這些概念最近都很火,但很多人搞不清楚它究竟是啥,準備從技術的角度,從架構的角度,用通俗的語言談談樓主的理解。
究竟啥是區(qū)塊鏈?
答:一句話,區(qū)塊鏈是一個存儲系統(tǒng)。
更細一點,區(qū)塊鏈是一個沒有管理員,每個節(jié)點都擁有全部數(shù)據(jù)的分布式存儲系統(tǒng)。
通常所見的存儲系統(tǒng)是啥樣的?
答:如上圖,一塊空間存儲數(shù)據(jù),一個軟件管理數(shù)據(jù),提供接口寫入數(shù)據(jù),這是存儲系統(tǒng),例如mysql。
普通的存儲系統(tǒng)會有什么常見的問題?
答:常見的有兩個問題:
- 數(shù)據(jù)存在一個地方很危險,空間損壞數(shù)據(jù)就丟了,用技術的話說即“數(shù)據(jù)不高可用”
- 寫入點只有一個,用技術的話說即“單點控制”
如何保證數(shù)據(jù)高可用?
答:解決高可用要“冗余”,如上圖,如果能把數(shù)據(jù)冗余到多個地方,就能保證高可用,一個地方的數(shù)據(jù)掛了,另外的地方仍存有數(shù)據(jù)。例如mysql主從集群,以及磁盤的RAID都是這個原理。
這里需要強調兩點:
- 數(shù)據(jù)冗余往往會引發(fā)一致性問題,例如mysql主從集群中的讀寫延時問題
- 數(shù)據(jù)冗余往往會降低寫入效率,因為同步數(shù)據(jù)需要消耗額外的資源
畫外音:更詳細的,可閱讀《互聯(lián)網(wǎng)架構,如何保證高可用》。
可不可以多點寫入?
答:可以??梢远鄠€節(jié)點都實施寫入,例如mysql雙主集群,又或者多機房多活數(shù)據(jù)中心。這里要強調的是,多節(jié)點寫入往往會引發(fā)寫寫沖突的一致性問題。
畫外音:雙主一致性,可閱讀《mysql雙主架構如何保證一致性》。
多點控制寫入之后,其實出現(xiàn)了多中心控制,在數(shù)據(jù)不一致的時候,往往需要有一個算法來協(xié)商如何處理不一致數(shù)據(jù)。
例如,存在兩個中心節(jié)點時,可以約定這樣的算法來處理不一致:
- 以時間戳最小的數(shù)據(jù)為準,即先來先得
又例如,存在多個中心節(jié)點時,可以約定這樣的算法來處理不一致:
- 投票,以多數(shù)票的數(shù)據(jù)為準
什么是區(qū)塊鏈?
答:
- 區(qū)塊是一塊存儲空間,可以存儲數(shù)據(jù)
- 區(qū)塊鏈不但像鏈表一樣把區(qū)塊串起來,還有約定了一系列的方法管理這些數(shù)據(jù),所以它是存儲系統(tǒng)
- 區(qū)塊鏈有很多節(jié)點,每個節(jié)點都保存了全部的數(shù)據(jù),所以它是高可用的
- 每一個中心節(jié)點都可以生成區(qū)塊,并寫入數(shù)據(jù),所以每一個點都是中心節(jié)點,或者說區(qū)塊鏈是去中心化的,要想控制整個系統(tǒng),必須控制一半以上的節(jié)點,才能控制投票,于是這個系統(tǒng)沒有管理員
綜上,區(qū)塊鏈實際上是一個沒有管理員的,去中心化的,每個節(jié)點都擁有全部數(shù)據(jù)的分布式存儲系統(tǒng)。只要你愿意,你隨時可以成為區(qū)塊鏈中的一個節(jié)點,并參與區(qū)塊的生成與寫入,比特幣就是基于這個分布式存儲上的電子貨幣。
由于節(jié)點很多,很多數(shù)據(jù)需要同步,這個系統(tǒng)的存儲容量其實不大,目前全球存儲比特幣的區(qū)塊鏈也就100多G。
畫外音:額,有朋友說他們公司的mysql數(shù)據(jù)庫輕輕松松幾百G。
因為節(jié)點很多,數(shù)據(jù)需要保持一致,這個系統(tǒng)的寫入效率也很低,存儲比特幣的區(qū)塊鏈每10分鐘才生成1個區(qū)塊,1個區(qū)塊只有1M的存儲空間,只夠寫入2000筆比特幣交易的數(shù)據(jù)。
畫外音:比特幣全球交易,每10分鐘只能處理2000筆交易。有朋友說他們公司自研的存儲系統(tǒng)輕輕松松;每秒處理交易10W筆。
關于區(qū)塊鏈,本文只說了概念,作為一個存儲系統(tǒng),數(shù)據(jù)的生成,寫入,管理,數(shù)據(jù)一致性,數(shù)據(jù)沖突處理方法,數(shù)據(jù)完整性保證…很多細節(jié)未來再用“通俗技術性文字”和大家分享。
希望這一分鐘,大家了解了區(qū)塊鏈的本質。