自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<s id="tg6qo"><li id="tg6qo"><menuitem id="tg6qo"></menuitem></li></s>

<sub id="tg6qo"><p id="tg6qo"></p></sub>

<sub id="tg6qo"></sub>

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫

賬號(hào)設(shè)置退出

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

作者：Spark大數(shù)據(jù)開發(fā) 2019-05-08 14:18:40

存儲(chǔ) 存儲(chǔ)軟件 Hadoop

CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多，在寫一次讀多次的場(chǎng)景下非常適合使用;社區(qū)比較活躍，響應(yīng)也很及時(shí)。目前官網(wǎng)發(fā)布版本1.3.0與最新的spark穩(wěn)定版Spark2.2.1集成，增加了支持標(biāo)準(zhǔn)的Hive分區(qū)，支持流數(shù)據(jù)準(zhǔn)實(shí)時(shí)入庫等新特性，相信會(huì)有越來越多的項(xiàng)目會(huì)使用到。加米谷大數(shù)據(jù)轉(zhuǎn)給大家參考學(xué)習(xí)。

CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多，在寫一次讀多次的場(chǎng)景下非常適合使用;社區(qū)比較活躍，響應(yīng)也很及時(shí)。目前官網(wǎng)發(fā)布版本1.3.0與***的spark穩(wěn)定版Spark2.2.1集成，增加了支持標(biāo)準(zhǔn)的Hive分區(qū)，支持流數(shù)據(jù)準(zhǔn)實(shí)時(shí)入庫等新特性，相信會(huì)有越來越多的項(xiàng)目會(huì)使用到。

一、評(píng)測(cè)環(huán)境

1)網(wǎng)絡(luò)拓?fù)鋱D

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

2)配置參數(shù)

Ø 服務(wù)器配置

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

二、性能對(duì)比

目前主流hadoop的文件存儲(chǔ)格式有行存儲(chǔ)的CSV格式，列式存儲(chǔ)的ORC和Parquet等。本章給出的是Parquet+Spark和CarbonData+Spark在過濾查詢場(chǎng)景和聚合計(jì)算場(chǎng)景的性能測(cè)試結(jié)果。

1)測(cè)試數(shù)據(jù)

創(chuàng)建沈陽社保的數(shù)據(jù)倉庫，導(dǎo)入、集成1年的測(cè)試數(shù)據(jù)，如下表：

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

生成CarbonData格式文件，如下表：

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

2)過濾查詢場(chǎng)景測(cè)試

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

Parquet和CarbonData在過濾查詢場(chǎng)景下的性能對(duì)比

3)聚合計(jì)算場(chǎng)景測(cè)試

Parquet和CarbonData在聚合計(jì)算場(chǎng)景下的性能對(duì)比

4)總結(jié)分析

在過濾查詢中，CarbonData的查詢效率比parquet效率好，主要體現(xiàn)在列數(shù)據(jù)的索引查詢，極大地提高了精確查詢的性能。在聚合查詢中，CarbonData通過使用全局字典編碼來加快計(jì)算速度，這使得處理、查詢引擎可以直接在編碼好的數(shù)據(jù)上進(jìn)行處理而不需要轉(zhuǎn)換數(shù)據(jù)，數(shù)據(jù)只有在返回結(jié)果給用戶的時(shí)候才轉(zhuǎn)換成用戶可讀的形式，通過索引有效過濾文件數(shù)據(jù)塊減少磁盤的IO，提高查詢性能。

基于Hadoop生態(tài)系統(tǒng)的一高性能數(shù)據(jù)存儲(chǔ)格式CarbonData（性能篇）

三、小結(jié)

CarbonData在數(shù)據(jù)查詢的性能表現(xiàn)比Parquet好很多，在寫一次讀多次的場(chǎng)景下非常適合使用;社區(qū)比較活躍，響應(yīng)也很及時(shí)。目前官網(wǎng)發(fā)布版本1.3.0與***的spark穩(wěn)定版Spark2.2.1集成，增加了支持標(biāo)準(zhǔn)的Hive分區(qū)，支持流數(shù)據(jù)準(zhǔn)實(shí)時(shí)入庫等新特性，相信會(huì)有越來越多的項(xiàng)目會(huì)使用到。

責(zé)任編輯：武曉燕來源：今日頭條

Hadoop 存儲(chǔ)CarbonData

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)