自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<sub id="tnlbr"></sub>}

<cite id="tnlbr"></cite>

^{<sub id="tnlbr"></sub>}

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Oracle和MySQL的JDBC到底有多慢？

作者：大數(shù)據(jù)小諸葛 2019-09-20 18:35:22

數(shù)據(jù)庫 Oracle MySQL

經(jīng)常聽人說，數(shù)據(jù)庫的IO性能不佳，但說歸說，并沒有感性認(rèn)識。我們現(xiàn)在就來實(shí)際測試一下，常用的Oracle和MySQL的JDBC讀取性能如何。

經(jīng)常聽人說，數(shù)據(jù)庫的IO性能不佳，但說歸說，并沒有感性認(rèn)識。我們現(xiàn)在就來實(shí)際測試一下，常用的Oracle和MySQL的JDBC讀取性能如何。

之所以測試JDBC，是因?yàn)榇蟛糠謶?yīng)用是JAVA寫的，也就只能用JDBC來訪問數(shù)據(jù)。這里僅測試用JDBC讀出數(shù)據(jù)，并產(chǎn)生成Java的記錄對象（畢竟到了這一步才能在應(yīng)用中使用），不作任何計(jì)算。

1. 數(shù)據(jù)來源

使用TPCH生成的數(shù)據(jù)，選用其中的customer表來做測試，數(shù)據(jù)記錄為3000萬行，8個(gè)字段。它生成的原始文本文件名為customer.tbl，文件大小為4.9G。利用數(shù)據(jù)庫提供的數(shù)據(jù)導(dǎo)入工具將此文件數(shù)據(jù)導(dǎo)入到Oracle和MySQL的數(shù)據(jù)表中。

2. 測試環(huán)境

在一臺Intel服務(wù)器上完成測試，2個(gè)Intel2670 CPU，主頻2.6G，共16核，內(nèi)存64G。數(shù)據(jù)庫表數(shù)據(jù)及文本文件均存儲在同一塊SSD硬盤上。

所有測試均在服務(wù)器本機(jī)上完成，沒有消耗網(wǎng)絡(luò)傳輸時(shí)間。

3. 數(shù)據(jù)庫讀數(shù)測試

通過Oracle提供的JDBC接口，用SQL語句執(zhí)行數(shù)據(jù)讀取。

Java寫起來麻煩，用SPL腳本執(zhí)行測試：

Oracle 和 MySQL 的 JDBC 到底有多慢？

MySQL的測試代碼類似，不再贅述。

測試結(jié)果（時(shí)間單位：秒）

Oracle 和 MySQL 的 JDBC 到底有多慢？

第二次可能由于操作系統(tǒng)有了硬盤緩存，所以更快。因?yàn)槲覀冎饕菫榱藴y試JDBC的讀取時(shí)間，所以就以第二次為準(zhǔn)，減少數(shù)據(jù)庫本身從硬盤讀數(shù)的影響。每秒讀出行數(shù)也是按第二次時(shí)間來計(jì)算的，也就是說，Oracle每秒能讀出10萬行多數(shù)據(jù)，MySQL大概接近8萬行。當(dāng)然這個(gè)值和表的字段數(shù)及類型都有關(guān)（customer表有8個(gè)字段），只是一種參考。

4. 文本文件對比

只從上面的數(shù)據(jù)量還沒有太多感性認(rèn)識，我們再讀一下文本文件來對比。辦法是一樣的，從文件中讀出數(shù)據(jù)，并解析出記錄，不作任何計(jì)算。

編寫如下SPL腳本執(zhí)行測試：

Oracle 和 MySQL 的 JDBC 到底有多慢？

測試結(jié)果是42秒！

這意味著，讀取文本要比讀取Oracle快281/42=6.69倍，比MySQL要快381/42=9.07倍！

我們知道，文本解析是個(gè)非常麻煩的事情，但即使這樣，從文本文件讀取數(shù)據(jù)還是遠(yuǎn)遠(yuǎn)快于從數(shù)據(jù)庫中讀數(shù)。Oracle和MySQL的IO實(shí)在是太慢了！

5. 二進(jìn)制方式

我們進(jìn)一步再看使用二進(jìn)制方式的存儲格式的讀取性能，并和文本比對。

為了對比明顯，這次換一個(gè)更大的表，用TPCH中的orders表，有3億行數(shù)據(jù)，9個(gè)字段。

文本讀取的代碼和上面類似，讀取時(shí)間測試為438秒。

然后，我們將這個(gè)文本文件轉(zhuǎn)換成SPL組表，再寫代碼測試：

Oracle 和 MySQL 的 JDBC 到底有多慢？

測試結(jié)果是164秒，大概僅僅是文本讀取的三分之一。

這是情理之中的事情，因?yàn)槎M(jìn)制數(shù)據(jù)不再需要解析，可以直接產(chǎn)生對象，計(jì)算量少了很多，因而要更快。

需要說明的是，組表文件雖然采用列存格式，但在這里讀出了所有列，并沒有比文本少取任何內(nèi)容，沒有占列存的便宜。事實(shí)上，因?yàn)樽x所有列，使用列存還會吃點(diǎn)虧，如果采用SPL集文件（一種行存格式）還會更快。

6. 并行提速

從文件中取數(shù)還很容易實(shí)現(xiàn)并行，文本和組表都容易寫出并行程序。還是用上面的orders表為例來測試，使用4線程取數(shù)。

文本取數(shù)代碼：

Oracle 和 MySQL 的 JDBC 到底有多慢？

組表取數(shù)代碼：

Oracle 和 MySQL 的 JDBC 到底有多慢？

用SPL很容易實(shí)現(xiàn)數(shù)據(jù)分段和并行計(jì)算。

測試結(jié)果為：

文本 119秒

組表 43秒

與串行相比，接近了線性提升，將CPU的多核充分利用起來了。

數(shù)據(jù)庫中的數(shù)據(jù)則不容易簡單地實(shí)施分段并行，需要用WHERE條件去拼，結(jié)果很難說清到底是并行不力還是WHERE執(zhí)行損失太多，測試結(jié)果的參考意義就打折扣了，這里就不再做了。

7. 結(jié)論

數(shù)據(jù)庫（Oracle和MySQL）的JDBC性能非常非常差！比文本文件還要差5倍以上。而采用二進(jìn)制數(shù)據(jù)時(shí)，會比文本再提高3倍的讀取性能。也就是說，合理格式的二進(jìn)制文件會比數(shù)據(jù)庫有15倍以上的優(yōu)勢。再考慮到并行因素，比數(shù)據(jù)庫快出幾十上百倍也是完全可能的。

在關(guān)注性能且數(shù)據(jù)量較大時(shí)，千萬不要把數(shù)據(jù)讀出數(shù)據(jù)庫計(jì)算！

如果實(shí)在需要讀出后再計(jì)算（有時(shí)SQL很難寫出復(fù)雜的過程計(jì)算），就不要再用數(shù)據(jù)庫存儲了（大數(shù)據(jù)都是歷史，基本也不再改了，可以事先讀出），用文本都比數(shù)據(jù)庫強(qiáng)，用二進(jìn)制當(dāng)然更好（推薦使用SPL組表，哈哈）。切不要把時(shí)間浪費(fèi)在讀數(shù)這種非計(jì)算任務(wù)上了。

責(zé)任編輯：龐桂玉來源：今日頭條

Oracle MySQL 數(shù)據(jù)庫

點(diǎn)贊

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<cite id="wnfup"><track id="wnfup"></track></cite>

^{<blockquote id="wnfup"></blockquote>}<blockquote id="wnfup"><i id="wnfup"><video id="wnfup"></video></i></blockquote>