自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<style id="cjinj"></style>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

換了個(gè)數(shù)據(jù)結(jié)構(gòu)，一不小心把系統(tǒng)性能提升了10倍以上

作者：石杉的架構(gòu)筆記 2022-09-27 18:19:32

開發(fā) 前端

Hadoop是世界上最復(fù)雜的基于Java開發(fā)的分布式系統(tǒng)，因此我們選用它來進(jìn)行舉例。從它的算法優(yōu)化對(duì)系統(tǒng)性能的提升，就可以看出算法對(duì)于Java程序員們開發(fā)系統(tǒng)的重要性。

?很多Java開發(fā)同學(xué)經(jīng)常有一個(gè)疑惑，搞Java開發(fā)也需要懂算法嗎？本文咱們就來談?wù)勥@個(gè)問題。

其實(shí)如果你開發(fā)一個(gè)非常復(fù)雜而且有挑戰(zhàn)的大型系統(tǒng)，那么必然會(huì)在系統(tǒng)中使用算法。同理，如果你可以將算法進(jìn)行合理的優(yōu)化，那么也可以將系統(tǒng)性能提升幾十倍！

空口無憑，下面用真實(shí)案例來進(jìn)行說明。我們一起來看看Hadoop在部署了大規(guī)模的集群場(chǎng)景下，大量客戶端并發(fā)寫數(shù)據(jù)的時(shí)候，文件契約監(jiān)控算法的性能優(yōu)化。

Hadoop是世界上最復(fù)雜的基于Java開發(fā)的分布式系統(tǒng)，因此我們選用它來進(jìn)行舉例。從它的算法優(yōu)化對(duì)系統(tǒng)性能的提升，就可以看出算法對(duì)于Java程序員們開發(fā)系統(tǒng)的重要性。

先給大家來引入一個(gè)小的背景，假如多個(gè)客戶端同時(shí)要并發(fā)的寫Hadoop HDFS上的一個(gè)文件，大家覺得這個(gè)事兒能成嗎？

明顯不可以接受啊，兄弟們，HDFS上的文件是不允許并發(fā)的寫的，比如并發(fā)的追加一些數(shù)據(jù)什么的。

所以說，HDFS里有一個(gè)機(jī)制，叫做文件契約機(jī)制

也就是說，同一時(shí)間只能有一個(gè)客戶端獲取NameNode上面一個(gè)文件的契約，然后才可以寫入數(shù)據(jù)，此時(shí)其他客戶端嘗試獲取文件契約的時(shí)候，就獲取不到，只能干等著。通過這個(gè)機(jī)制就可以保證同一時(shí)間只有一個(gè)客戶端在寫一個(gè)文件。

在獲取到了文件契約之后，在寫文件的過程期間，那個(gè)客戶端需要開啟一個(gè)線程來不停的發(fā)送請(qǐng)求給NameNode進(jìn)行文件續(xù)約，告訴NameNode：大哥，我這還在寫文件呢，你給我一直保留那個(gè)契約好嗎？

NameNode內(nèi)部有一個(gè)專門的后臺(tái)線程負(fù)責(zé)監(jiān)控各個(gè)契約的續(xù)約時(shí)間，如果某個(gè)契約很長(zhǎng)時(shí)間沒續(xù)約了，此時(shí)就自動(dòng)過期掉這個(gè)契約，讓別的客戶端來寫。

大家看下面的圖：

好，問題來了，假如我們有一個(gè)大規(guī)模部署到hadoop集群，同時(shí)存在的客戶端可能多達(dá)成千上萬(wàn)個(gè)，此時(shí)NameNode內(nèi)部維護(hù)的那個(gè)文件契約列表會(huì)非常非常的大。

而監(jiān)控契約的后臺(tái)線程又需要每隔一段時(shí)間就檢查一下所有的契約是否過期，比如每隔幾秒鐘就遍歷大量的契約，那么勢(shì)必造成性能不佳，明顯這種契約監(jiān)控機(jī)制是不適合大規(guī)模部署的hadoop集群的。

那Hadoop是如何對(duì)文件契約監(jiān)控算法進(jìn)行優(yōu)化的呢？咱們一步一步看一下他的實(shí)現(xiàn)邏輯，先一起來看下圖：

奧秘十分的簡(jiǎn)單，每次一個(gè)客戶端發(fā)送續(xù)約請(qǐng)求之后，就設(shè)置這個(gè)契約的最近一次續(xù)約時(shí)間，然后基于一個(gè)TreeSet數(shù)據(jù)結(jié)構(gòu)來根據(jù)最近一次續(xù)約時(shí)間對(duì)契約進(jìn)行排序，每次都把續(xù)約時(shí)間最老的契約排在最前頭，這個(gè)排序后的契約數(shù)據(jù)結(jié)構(gòu)十分的重要。

TreeSet是一種可排序的數(shù)據(jù)結(jié)構(gòu)，他底層基于TreeMap來實(shí)現(xiàn)，而TreeMap底層基于紅黑樹來實(shí)現(xiàn)，可以保證元素沒有重復(fù)，同時(shí)還能按照我們自己定義的排序規(guī)則在你每次插入一個(gè)元素的時(shí)候來進(jìn)行自定義的排序。

所以這里我們的排序規(guī)則，就是按照契約的最近一次續(xù)約時(shí)間來排序即可。

其實(shí)這個(gè)優(yōu)化就是如此的簡(jiǎn)單，就是維護(hù)這么一個(gè)排序數(shù)據(jù)結(jié)構(gòu)而已。然后我們可以看一下Hadoop中的契約監(jiān)控的源碼實(shí)現(xiàn)：

Lease leaseToCheck = null;
   try {
     leaseToCheck = sortedLeases.first();
   } catch(NoSuchElementException e) {}
   while(leaseToCheck != null) {
     if (!leaseToCheck.expiredHardLimit()) {
       break;
     }
   }

怎么樣？是不是不得不佩服那些寫出Hadoop、Spring Cloud等優(yōu)秀開源項(xiàng)目的大牛的技術(shù)水平，大量的閱讀各種復(fù)雜而且優(yōu)秀的開源項(xiàng)目的源碼，確實(shí)是可以快速的提升一個(gè)人的架構(gòu)能力、技術(shù)能力和技術(shù)視野，這也是我平時(shí)花費(fèi)大量時(shí)間做的事情。

每次檢查契約是否過期的時(shí)候，你不要遍歷成千上萬(wàn)的契約，那樣遍歷效率很低下，完全可以就從TreeSet中獲取續(xù)約時(shí)間最老的那個(gè)契約

假如說連最近一次續(xù)約時(shí)間最老的那個(gè)契約都還沒過期，那么就不用繼續(xù)檢查了??！因?yàn)檎f明續(xù)約時(shí)間更近的那些契約絕對(duì)不會(huì)過期！

舉個(gè)例子，續(xù)約時(shí)間最老的那個(gè)契約，最近一次續(xù)約的時(shí)間是10分鐘以前，但是我們判斷契約過期的限制是超過15分鐘不續(xù)約就過期那個(gè)契約。

這個(gè)時(shí)候連10分總以前續(xù)約的契約都沒有過期，那么那些8分鐘以前，5分鐘以前續(xù)約的契約，肯定也不會(huì)過期了，就是這個(gè)意思！

這個(gè)機(jī)制對(duì)性能的提升是相當(dāng)有幫助的，因?yàn)檎碚f，過期的契約肯定還是占少數(shù)，所以壓根兒不用每次都遍歷所有的契約來檢查是否過期，只要檢查續(xù)約時(shí)間最舊的那幾個(gè)契約就可以了。

如果一個(gè)契約過期了，那么就刪掉那個(gè)契約，然后再檢查第二舊的契約好了。以此類推。

通過這個(gè)TreeSet排序 + 優(yōu)先檢查最舊契約的機(jī)制，有效的將大規(guī)模集群下的契約監(jiān)控機(jī)制的性能提升至少10倍以上，這個(gè)思想，在我們自己進(jìn)行系統(tǒng)設(shè)計(jì)時(shí)，是非常值得我們學(xué)習(xí)和借鑒的。

給大家引申一下，在Spring Cloud微服務(wù)架構(gòu)中，Eureka作為注冊(cè)中心其實(shí)也有續(xù)約檢查的機(jī)制，跟Hadoop是類似的（不清楚的同學(xué)建議看一下：《SpringCloud精妙的設(shè)計(jì)，你還不知道?》）

但是在Eureka中就沒有實(shí)現(xiàn)類似的續(xù)約優(yōu)化機(jī)制，而是暴力的每一輪都遍歷所有的服務(wù)實(shí)例的續(xù)約時(shí)間。

假如你是一個(gè)大規(guī)模部署的微服務(wù)系統(tǒng)呢？比如部署了幾十萬(wàn)臺(tái)機(jī)器的大規(guī)模系統(tǒng)，有幾十萬(wàn)個(gè)服務(wù)實(shí)例的續(xù)約信息駐留在Eureka的內(nèi)存中，你難道要每隔幾秒鐘遍歷一下幾十萬(wàn)個(gè)服務(wù)實(shí)例的續(xù)約信息嗎？?

責(zé)任編輯：武曉燕來源：今日頭條

Java 數(shù)據(jù)結(jié)構(gòu)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<cite id="e8kok"></cite>