自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

阿里5位嘉賓3個分享:HBaseCon Asia 2017干貨滿滿

原創(chuàng)
開發(fā) 項目管理 大數(shù)據(jù)
秉承開源和分享的精神,阿里把HBase的實踐經(jīng)驗和改進(jìn)不斷回饋HBase社區(qū),比如說Bucket Cache和Reverse Scan等功能,給HBase技術(shù)發(fā)展帶來了非常深遠(yuǎn)的影響。同時,也給HBase社區(qū)培養(yǎng)了2名PMC和2名Committer,阿里在HBase社區(qū)的影響力可見一斑。那么這次HBaseCon 2017 Asia。阿里派出了一位HBase PMC和2位Committer,還有兩位資深的HBase開發(fā),給大家?guī)砹耸愕母韶洝?/div>

HBaseCon是Apache HBase官方舉辦的技術(shù)會議,主要目的是分享,交流HBase這個開源分布式大數(shù)據(jù)存儲的使用和開發(fā)以及發(fā)展。HBaseCon發(fā)起于2012年。通常HBaseCon的舉辦地是在美國,這是HBaseCon***次在亞洲舉行,命名為Apache HBaseCon 2017 Asia。而且這次會議舉辦地選擇在中國深圳,也足以見得HBase在中國的火爆程度和中國開發(fā)者們對HBase社區(qū)所做的卓越貢獻(xiàn)。

[[199503]]

Apache HBase是基于Apache Hadoop構(gòu)建的一個分布式、可伸縮的Key-Value數(shù)據(jù)庫,它提供了大數(shù)據(jù)背景下的高性能的隨機讀寫能力。做為最早研究、使用和二次開發(fā)HBase技術(shù)的中國公司,阿里巴巴從2010年就開始使用HBase,經(jīng)過近7年的發(fā)展,現(xiàn)在采用HBase存儲的業(yè)務(wù)已經(jīng)超過1000+,擁有了上萬臺的HBase集群規(guī)模,在HBase上存儲的數(shù)據(jù)已達(dá)PB級。秉承開源和分享的精神,阿里把HBase的實踐經(jīng)驗和改進(jìn)不斷回饋HBase社區(qū),比如說Bucket Cache和Reverse Scan等功能,給HBase技術(shù)發(fā)展帶來了非常深遠(yuǎn)的影響。同時,也給HBase社區(qū)培養(yǎng)了2名PMC和2名Committer,阿里在HBase社區(qū)的影響力可見一斑。那么這次HBaseCon 2017 Asia。阿里派出了一位HBase PMC和2位Committer,還有兩位資深的HBase開發(fā),給大家?guī)砹耸愕母韶洝?/p>

阿里干貨系列

一、強同步復(fù)制

傳統(tǒng)的HBase主備集群同步使用的方案是異步復(fù)制,這使得主備集群數(shù)據(jù)之間會有短暫的數(shù)據(jù)不同步現(xiàn)象。用戶為了災(zāi)備,不得不放棄強一致模型。沒法放棄強一致語義的用戶,必須自己寫一套復(fù)雜的邏輯來保證主備集群之間數(shù)據(jù)的讀寫一致性。阿里的HBase技術(shù)專家天引,在此次的HBaseCon Asia上給大家?guī)砹藦娡綇?fù)制方案。

[[199504]]

據(jù)天引介紹,強同步復(fù)制方案采用了主備并發(fā)寫和RemoteLog技術(shù),使得在同城網(wǎng)絡(luò)條件下同步復(fù)制相對于異步復(fù)制僅有2%的吞吐量下降。當(dāng)一個請求到達(dá)主庫后,并發(fā)寫本地和備庫,到達(dá)備庫的同步寫不需要走完整的寫入路徑,而是直接寫入RemoteLog,降低同步寫開銷與延時。除了同步鏈路外,還有一套異步鏈路將數(shù)據(jù)從主庫復(fù)制到備庫,因此正常情況下不需要回放RemoteLog的數(shù)據(jù)到備庫,在主庫不可服務(wù)的情況下,只需要回放RemoteLog中那些還沒有被異步復(fù)制鏈路同步到備庫的數(shù)據(jù),異步復(fù)制只有幾秒鐘的數(shù)據(jù)延遲,這保證了可以在很短的時間內(nèi)完成從主庫到備庫的切換。

此方案在大會現(xiàn)場引起了強烈反響,很多HBase用戶表示這是他們期待已久的功能,希望能盡快使用上。天引表示此功能目前基于阿里內(nèi)部分支實現(xiàn)、運行及完善,未來將會回饋給社區(qū)。

二、SQL on HBase

阿里HBase服務(wù)了大量的內(nèi)部用戶,并持續(xù)有新用戶接入。但是使用HBase的用戶有很大一部分是從傳統(tǒng)的SQL數(shù)據(jù)庫轉(zhuǎn)過來的,HBase的rowkey設(shè)計和API的使用習(xí)慣對于他們來說并不友好。為了降低這些轉(zhuǎn)型用戶的使用門檻,阿里在HBase上引入了SQL層。來自阿里的資深HBase開發(fā)工程師天穆,給大家詳細(xì)講解了如何玩轉(zhuǎn)SQL on HBase。

[[199505]]

通過優(yōu)化,現(xiàn)在在阿里使用SQL訪問HBase和原生API的速度已經(jīng)相差無幾,而且在SQL語法上,創(chuàng)造性地支持HBase多版本和時間戳等NoSQL才具有的功能。

另外,在HBase上同時支持了全局二級索引和本地二級索引。使用戶可以在多列上建立索引,簡化了業(yè)務(wù)的設(shè)計,提升了請求效率,降低了使用成本。

三、跨集群分區(qū)拷貝

HBase上通常承載著海量的數(shù)據(jù),而在日常生產(chǎn)過程中,隨著業(yè)務(wù)的發(fā)展和公司數(shù)據(jù)中心的規(guī)劃等原因,這些海量數(shù)據(jù)需要經(jīng)常搬遷,這通常對于運維來說是一個非常頭疼的問題。來自阿里的HBase社區(qū)Committer正研,分享了阿里跨集群分區(qū)拷貝的場景和成熟解決方案。

[[199506]]

正研首先介紹了在阿里內(nèi)部常見的需要數(shù)據(jù)拷貝的場景,比如說新建數(shù)據(jù)中心,HBase集群需要整體搬遷到新的機房;又比如說不同機房內(nèi)的HBase集群的增量數(shù)據(jù)同步,可以用replication來解決,但是對于存量數(shù)據(jù),目前還沒有比較高效的方案;另外還一個常見場景就是數(shù)據(jù)恢復(fù),而傳統(tǒng)的HBase備份還原工具都沒法控制數(shù)據(jù)恢復(fù)的范圍。

因此,阿里研發(fā)了Range Data Copy功能內(nèi)置在HBase中,提供了一個簡單高效,而且能夠自動處理各種錯誤情況和災(zāi)難恢復(fù)的數(shù)據(jù)拷貝功能,使用這個功能拷貝一張200TB的表到另外一個集群,所需時間不到5小時。

四、讀寫鏈路優(yōu)化

在阿里使用HBase的過程中,對HBase本身做了非常多的讀寫性能優(yōu)化。來自阿里的HBase社區(qū)PMC絕頂和Committer天照,一起給大家分享了阿里在這方面所取得的一些成果。

[[199507]]

1、使用Netty替代HBase原生的RPC server,大大提升了HBaseRPC的吞吐能力,降低了延遲 ;

2、 引入新的HFileBlock編碼格式,把順序搜索變成了二分查找,提高了HBase隨機讀的能力

 

3、拆分寫鏈路,釋放阻塞的handler資源,提高了HBase寫的吞吐能力 ;

來自阿里的這些優(yōu)化黑科技,使HBase的能力又更上一個新臺階。并且這些優(yōu)化和功能目前已經(jīng)回饋給了社區(qū),所有的HBase用戶都能在新版本的使用獲得這些技術(shù)紅利。

總結(jié)

除了阿里帶來的技術(shù)分享,現(xiàn)場許多其他公司也都帶來了他們對HBase做出的改進(jìn)和使用經(jīng)驗。比如說小米實現(xiàn)了AsyncClient,填補了HBase沒有原生異步API的缺口;知乎使用kubernetes自動擴容縮容HBase集群,靈活地適應(yīng)業(yè)務(wù)高速發(fā)展和瞬息萬變;烽火網(wǎng)絡(luò)隔離讀寫資源使近線查詢更加穩(wěn)定等等。

除了上述提到的這幾個亮點技術(shù)分享,此次HBaseCon大會的每一個session都非常精彩,給大家?guī)砹艘粓鲇忠粓鏊季S碰撞的盛宴。Apache HBase“掌門人”Michael Stack也參加了此次會議,并與HBase開發(fā)者們舉行了一次圓桌會議,共同探討HBase的現(xiàn)狀和未來。

[[199508]]

這次HBaseCon的火爆程度,直接展示了國內(nèi)企業(yè)和開發(fā)者們對HBase熱情和期望。HBaseCon大會不僅給HBase的使用者們帶來了***鮮的技術(shù)進(jìn)展,互通有無,吸收其他公司的先進(jìn)經(jīng)驗;也成為HBase使用者和開發(fā)者之間溝通的橋梁,能讓開發(fā)者們看到業(yè)界動態(tài),用戶的需求,共同把HBase打造成一個更加易用,更高性能,更穩(wěn)定的大數(shù)據(jù)存儲。這次HBaseCon大會是一個很好的開端,期望HBaseCon Asia越辦越好,給大家?guī)砀嗟母韶?

[[199509]]

***

如果你對大數(shù)據(jù)在線存儲、對HBase感興趣,或者是想更好地使用HBase、開發(fā)更NB的產(chǎn)品,歡迎聯(lián)系我們(正研,zhengyan.ywl@alibaba-inc.com),一起交流,互相學(xué)習(xí)!

作者簡介:

楊文龍,花名正研,阿里巴巴存儲技術(shù)事業(yè)部資深研發(fā),HBase開源社區(qū)Committer。開源技術(shù)愛好者,對分布式存儲系統(tǒng)的設(shè)計、實踐具備豐富的大規(guī)模生產(chǎn)的經(jīng)驗。

責(zé)任編輯:王雪燕 來源: 51CTO
相關(guān)推薦

2017-07-11 09:59:01

HBaseCon

2017-04-18 11:33:52

軟件 生態(tài)

2018-01-29 12:39:56

數(shù)據(jù)庫MongoDB集群

2018-07-25 11:33:28

Apache

2013-04-09 17:27:19

GMIC球移動互聯(lián)網(wǎng)大會

2017-08-30 10:24:36

云計算大會演講嘉賓

2018-08-08 17:40:55

2017-11-09 17:35:21

數(shù)據(jù)庫OracleSQL優(yōu)化

2019-12-02 10:13:37

GitHub人生第一份工作程序員

2021-01-28 11:29:12

Python 開發(fā)編程語言

2022-08-19 09:24:46

計算機技術(shù)

2021-10-20 08:49:30

Vuexvue.js狀態(tài)管理模式

2018-01-25 15:38:22

程序員軟件工程師經(jīng)驗分享

2018-05-28 09:39:14

人工智能

2016-06-23 15:42:08

2019-03-29 15:34:39

Go框架Web

2020-05-07 09:39:49

VSCode開發(fā)代碼

2015-09-02 09:16:13

數(shù)據(jù)設(shè)計圖表

2020-09-28 15:14:46

網(wǎng)站科技技術(shù)
點贊
收藏

51CTO技術(shù)棧公眾號