HDInsight HBase的概述和應(yīng)用實(shí)例列舉
什么是HBase的?
HBase的是建立在的HadoopApache的開(kāi)源的NoSQL數(shù)據(jù)庫(kù),它提供了大量的非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)的隨機(jī)存取能力強(qiáng)的一致性。它是仿照谷歌的BigTable,是一個(gè)以家庭為中心的列式數(shù)據(jù)庫(kù)。數(shù)據(jù)被存儲(chǔ)在一個(gè)行內(nèi)的表和數(shù)據(jù)的行由列族分組。 HBase的是在這個(gè)意義上,無(wú)論是列也不存儲(chǔ)在其中的數(shù)據(jù)的類(lèi)型,需要使用它們之前,定義一個(gè)無(wú)模式數(shù)據(jù)庫(kù)。開(kāi)放源代碼是***發(fā)布由Mike Cafarella于2007年,線性擴(kuò)展處理PB級(jí)數(shù)據(jù)的數(shù)千個(gè)節(jié)點(diǎn)。它可以依賴于數(shù)據(jù)的冗余,批量處理和通過(guò)在的Hadoop生態(tài)系統(tǒng)的分布式應(yīng)用程序中提供的其他功能。
什么是AzureHDInsight HBase的?
HDInsight的HBase提供一個(gè)管理的集群集成到Azure環(huán)境。該簇被配置為直接在Azure斑點(diǎn)存儲(chǔ),這提供了在性能/成本選擇低等待時(shí)間和增加的彈性存儲(chǔ)數(shù)據(jù)。這使客戶能夠構(gòu)建大型數(shù)據(jù)集工作的交互式網(wǎng)站,構(gòu)建存儲(chǔ)傳感器和遙測(cè)數(shù)據(jù),從數(shù)以百萬(wàn)計(jì)的端點(diǎn)的服務(wù),以及分析這些數(shù)據(jù)與Hadoop作業(yè)。 HBase的和的Hadoop都是很好的出發(fā)點(diǎn),在Azure大數(shù)據(jù)項(xiàng)目,特別是,可以實(shí)現(xiàn)實(shí)時(shí)應(yīng)用與大型數(shù)據(jù)集工作。
在HDInsight實(shí)現(xiàn)利用HBase的的橫向擴(kuò)展架構(gòu),可提供自動(dòng)分片表,強(qiáng)一致性讀取和寫(xiě)入,和自動(dòng)故障轉(zhuǎn)移。性能提高了內(nèi)存高速緩存的讀取和高通量流式寫(xiě)入。虛擬網(wǎng)絡(luò)的配置也可用于HDInsight HBase的。有關(guān)詳細(xì)信息,請(qǐng)參閱提供HDInsight群集在Azure上的虛擬網(wǎng)絡(luò)。
如何在HDInsight HBase的數(shù)據(jù)管理?
數(shù)據(jù)可以在HBase的使用創(chuàng)造GET,PUT和掃描從HBase的shell命令進(jìn)行管理。數(shù)據(jù)通過(guò)表決,并閱讀使用get命令寫(xiě)入到數(shù)據(jù)庫(kù)中。掃描命令用于獲得在一個(gè)表中,從多行數(shù)據(jù)。數(shù)據(jù)也可以使用HBase的C#的API,它提供了一個(gè)客戶機(jī)庫(kù)的HBase的REST API的頂端管理。一個(gè)HBase的數(shù)據(jù)庫(kù)也可以使用Hive查詢。的介紹,這些編程模型,請(qǐng)參閱獲取使用HBase的用Hadoop在HDInsight開(kāi)始。協(xié)處理器也可以允許在數(shù)據(jù)庫(kù)所在的節(jié)點(diǎn)數(shù)據(jù)的處理。
場(chǎng)景:什么是用例HBase的?
BigTable,推而廣之,HBase的創(chuàng)建為其典型用例是網(wǎng)頁(yè)搜索。搜索引擎建立一個(gè)映射條款,包含它們的網(wǎng)頁(yè)索引。但也有很多其他的用例HBase的適用哪幾個(gè)的,都逐項(xiàng)本節(jié)。
用例1:key-value存儲(chǔ)
HBase的可作為一個(gè)鍵值存儲(chǔ),適用于管理信息系統(tǒng)。 Facebook的HBase的使用他們的郵件系統(tǒng),它是理想的存儲(chǔ)和管理網(wǎng)絡(luò)通信。 WebTable使用HBase的搜索和管理從網(wǎng)頁(yè)中提取表。
用例#2:傳感器數(shù)據(jù)
Hase的是用于捕獲是從各種來(lái)源的增量收集的數(shù)據(jù)是有用的。這包括社交分析,時(shí)間序列,保持交互式儀表盤(pán)了解***的趨勢(shì)和專柜,以及管理審計(jì)日志系統(tǒng)。例子包括彭博交易終端和開(kāi)放時(shí)間序列數(shù)據(jù)庫(kù)(OpenTSDB),它存儲(chǔ)并提供訪問(wèn)收集了服務(wù)器系統(tǒng)的健康指標(biāo)。
用例3:實(shí)時(shí)查詢
Phoenix是Apache HBase的一個(gè)SQL查詢引擎。它是作為一個(gè)JDBC驅(qū)動(dòng)程序和能使查詢和使用SQL管理HBase的表。
用例4:HBase的一個(gè)平臺(tái)
應(yīng)用程序可以在HBase的頂部使用它作為數(shù)據(jù)存儲(chǔ)上運(yùn)行。例子包括鳳凰城,OpenTSDB,KIJI,和Titan。應(yīng)用程序還可以整合HBase的。例子包括Hive,Pig,Solr的,風(fēng)暴,水槽,黑斑羚,星火,神經(jīng)節(jié)和鉆孔。
接下來(lái)的步驟
得到HDInsight開(kāi)始使用HBase的用Hadoop
提供HDInsight群集在Azure上的虛擬網(wǎng)絡(luò)
與HBase的在HDInsight分析微博人氣
使用Maven來(lái)構(gòu)建使用HBase的使用HDInsight Java應(yīng)用程序(的Hadoop)
C#HBase的SDK
另請(qǐng)參閱
Apache的HBase
Bigtable:分布式存儲(chǔ)系統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)
本文翻譯自Microsoft Azure官網(wǎng):http://azure.microsoft.com/en-us/documentation/articles/hdinsight-hbase-overview/
原文出自:http://blog.csdn.net/yangzhenping/article/details/40983023