自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

^{<sub id="nxynq"></sub>}

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓(xùn)

鴻蒙開發(fā)者社區(qū)

WOT技術(shù)大會

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認證廠商認證 IT技術(shù)PMP項目管理免費題庫

在線學(xué)習(xí)

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

賬號設(shè)置退出

Spark核心技術(shù)原理透視一（Spark運行原理）

作者：佚名 2018-03-21 11:05:26

大數(shù)據(jù) Spark

在大數(shù)據(jù)領(lǐng)域，只有深挖數(shù)據(jù)科學(xué)領(lǐng)域，走在學(xué)術(shù)前沿，才能在底層算法和模型方面走在前面，從而占據(jù)領(lǐng)先地位。Spark的這種學(xué)術(shù)基因，使得它從一開始就在大數(shù)據(jù)領(lǐng)域建立了一定優(yōu)勢。無論是性能，還是方案的統(tǒng)一性，對比傳統(tǒng)的Hadoop，優(yōu)勢都非常明顯。

在大數(shù)據(jù)領(lǐng)域，只有深挖數(shù)據(jù)科學(xué)領(lǐng)域，走在學(xué)術(shù)前沿，才能在底層算法和模型方面走在前面，從而占據(jù)領(lǐng)先地位。

Spark的這種學(xué)術(shù)基因，使得它從一開始就在大數(shù)據(jù)領(lǐng)域建立了一定優(yōu)勢。無論是性能，還是方案的統(tǒng)一性，對比傳統(tǒng)的Hadoop，優(yōu)勢都非常明顯。Spark提供的基于RDD的一體化解決方案，將MapReduce、Streaming、SQL、Machine Learning、Graph Processing等模型統(tǒng)一到一個平臺下，并以一致的API公開，并提供相同的部署方案，使得Spark的工程應(yīng)用領(lǐng)域變得更加廣泛。本文主要分以下章節(jié)：

一、Spark專業(yè)術(shù)語定義
二、Spark運行基本流程
三、Spark運行架構(gòu)特點
四、Spark核心原理透視

一、Spark專業(yè)術(shù)語定義

1、Application：Spark應(yīng)用程序

指的是用戶編寫的Spark應(yīng)用程序，包含了Driver功能代碼和分布在集群中多個節(jié)點上運行的Executor代碼。

Spark應(yīng)用程序，由一個或多個作業(yè)JOB組成，如下圖所示:

2、Driver：驅(qū)動程序

Spark中的Driver即運行上述Application的Main()函數(shù)并且創(chuàng)建SparkContext，其中創(chuàng)建SparkContext的目的是為了準備Spark應(yīng)用程序的運行環(huán)境。在Spark中由SparkContext負責和ClusterManager通信，進行資源的申請、任務(wù)的分配和監(jiān)控等;當Executor部分運行完畢后，Driver負責將SparkContext關(guān)閉。通常SparkContext代表Driver，如下圖所示:

3、Cluster Manager：資源管理器

指的是在集群上獲取資源的外部服務(wù)，常用的有：Standalone，Spark原生的資源管理器，由Master負責資源的分配;Haddop Yarn，由Yarn中的ResearchManager負責資源的分配;Messos，由Messos中的Messos Master負責資源管理，如下圖所示:

4、Executor：執(zhí)行器

Application運行在Worker節(jié)點上的一個進程，該進程負責運行Task，并且負責將數(shù)據(jù)存在內(nèi)存或者磁盤上，每個Application都有各自獨立的一批Executor，如下圖所示:

5、Worker：計算節(jié)點

集群中任何可以運行Application代碼的節(jié)點，類似于Yarn中的NodeManager節(jié)點。在Standalone模式中指的就是通過Slave文件配置的Worker節(jié)點，在Spark on Yarn模式中指的就是NodeManager節(jié)點，在Spark on Messos模式中指的就是Messos Slave節(jié)點，如下圖所示:

6、RDD：彈性分布式數(shù)據(jù)集

Resillient Distributed Dataset，Spark的基本計算單元，可以通過一系列算子進行操作(主要有Transformation和Action操作)，如下圖所示:

7、窄依賴

父RDD每一個分區(qū)最多被一個子RDD的分區(qū)所用;表現(xiàn)為一個父RDD的分區(qū)對應(yīng)于一個子RDD的分區(qū)，或兩個父RDD的分區(qū)對應(yīng)于一個子RDD 的分區(qū)。如圖所示:

8、寬依賴

父RDD的每個分區(qū)都可能被多個子RDD分區(qū)所使用，子RDD分區(qū)通常對應(yīng)所有的父RDD分區(qū)。如圖所示:

常見的窄依賴有：map、filter、union、mapPartitions、mapValues、join(父RDD是hash-partitioned ：如果JoinAPI之前被調(diào)用的RDD API是寬依賴(存在shuffle), 而且兩個join的RDD的分區(qū)數(shù)量一致，join結(jié)果的rdd分區(qū)數(shù)量也一樣，這個時候join api是窄依賴)。

常見的寬依賴有g(shù)roupByKey、partitionBy、reduceByKey、join(父RDD不是hash-partitioned ：除此之外的，rdd 的join api是寬依賴)。

9、DAG：有向無環(huán)圖

Directed Acycle graph，反應(yīng)RDD之間的依賴關(guān)系，如圖所示:

10、DAGScheduler：有向無環(huán)圖調(diào)度器

基于DAG劃分Stage 并以TaskSet的形勢提交Stage給TaskScheduler;負責將作業(yè)拆分成不同階段的具有依賴關(guān)系的多批任務(wù);最重要的任務(wù)之一就是：計算作業(yè)和任務(wù)的依賴關(guān)系，制定調(diào)度邏輯。在SparkContext初始化的過程中被實例化，一個SparkContext對應(yīng)創(chuàng)建一個DAGScheduler。

11、TaskScheduler：任務(wù)調(diào)度器

將Taskset提交給worker(集群)運行并回報結(jié)果;負責每個具體任務(wù)的實際物理調(diào)度。如圖所示:

12、Job：作業(yè)

由一個或多個調(diào)度階段所組成的一次計算作業(yè);包含多個Task組成的并行計算，往往由Spark Action催生，一個JOB包含多個RDD及作用于相應(yīng)RDD上的各種Operation。如圖所示:

13、Stage：調(diào)度階段

一個任務(wù)集對應(yīng)的調(diào)度階段;每個Job會被拆分很多組Task，每組任務(wù)被稱為Stage，也可稱TaskSet，一個作業(yè)分為多個階段;Stage分成兩種類型ShuffleMapStage、ResultStage。如圖所示:

14、TaskSet：任務(wù)集

由一組關(guān)聯(lián)的，但相互之間沒有Shuffle依賴關(guān)系的任務(wù)所組成的任務(wù)集。如圖所示:

提示：

一個Stage創(chuàng)建一個TaskSet;
為Stage的每個Rdd分區(qū)創(chuàng)建一個Task,多個Task封裝成TaskSet

15、Task：任務(wù)

被送到某個Executor上的工作任務(wù);單個分區(qū)數(shù)據(jù)集上的最小處理流程單元。如圖所示:

總體如圖所示：

二、Spark運行基本流程

三、Spark運行架構(gòu)特點

1、Executor進程專屬

每個Application獲取專屬的executor進程，該進程在Application期間一直駐留，并以多線程方式運行tasks。Spark Application不能跨應(yīng)用程序共享數(shù)據(jù)，除非將數(shù)據(jù)寫入到外部存儲系統(tǒng)。如圖所示:

2、支持多種資源管理器

Spark與資源管理器無關(guān)，只要能夠獲取executor進程，并能保持相互通信就可以了，Spark支持資源管理器包含： Standalone、On Mesos、On YARN、Or On EC2。如圖所示:

3、Job提交就近原則

提交SparkContext的Client應(yīng)該靠近Worker節(jié)點(運行Executor的節(jié)點)，***是在同一個Rack(機架)里，因為Spark Application運行過程中SparkContext和Executor之間有大量的信息交換;如果想在遠程集群中運行，***使用RPC將SparkContext提交給集群，不要遠離Worker運行SparkContext。如圖所示:

4、移動程序而非移動數(shù)據(jù)的原則執(zhí)行

Task采用了數(shù)據(jù)本地性和推測執(zhí)行的優(yōu)化機制。關(guān)鍵方法：taskIdToLocations、getPreferedLocations。如圖所示:

四、Spark核心原理透視

1、計算流程

2、從代碼構(gòu)建DAG圖

Spark program

Val lines1 = sc.textFile(inputPath1). map(···)). map(···)  
Val lines2 = sc.textFile(inputPath2) . map(···)  
Val lines3 = sc.textFile(inputPath3)  
Val dtinone1 = lines2.union(lines3)  
Val dtinone = lines1.join(dtinone1)  
dtinone.saveAsTextFile(···)  
dtinone.filter(···).foreach(···)

Spark的計算發(fā)生在RDD的Action操作，而對Action之前的所有Transformation，Spark只是記錄下RDD生成的軌跡，而不會觸發(fā)真正的計算。

Spark內(nèi)核會在需要計算發(fā)生的時刻繪制一張關(guān)于計算路徑的有向無環(huán)圖，也就是DAG。

3、將DAG劃分為Stage核心算法

Application多個job多個Stage：Spark Application中可以因為不同的Action觸發(fā)眾多的job，一個Application中可以有很多的job，每個job是由一個或者多個Stage構(gòu)成的，后面的Stage依賴于前面的Stage，也就是說只有前面依賴的Stage計算完畢后，后面的Stage才會運行。

劃分依據(jù)：Stage劃分的依據(jù)就是寬依賴，何時產(chǎn)生寬依賴，reduceByKey, groupByKey等算子，會導(dǎo)致寬依賴的產(chǎn)生。

核心算法：從后往前回溯，遇到窄依賴加入本stage，遇見寬依賴進行Stage切分。Spark內(nèi)核會從觸發(fā)Action操作的那個RDD開始從后往前推，首先會為***一個RDD創(chuàng)建一個stage，然后繼續(xù)倒推，如果發(fā)現(xiàn)對某個RDD是寬依賴，那么就會將寬依賴的那個RDD創(chuàng)建一個新的stage，那個RDD就是新的stage的***一個RDD。然后依次類推，繼續(xù)繼續(xù)倒推，根據(jù)窄依賴或者寬依賴進行stage的劃分，直到所有的RDD全部遍歷完成為止。

4、將DAG劃分為Stage剖析

從HDFS中讀入數(shù)據(jù)生成3個不同的RDD，通過一系列transformation操作后再將計算結(jié)果保存回HDFS?？梢钥吹竭@個DAG中只有join操作是一個寬依賴，Spark內(nèi)核會以此為邊界將其前后劃分成不同的Stage. 同時我們可以注意到，在圖中Stage2中，從map到union都是窄依賴，這兩步操作可以形成一個流水線操作，通過map操作生成的partition可以不用等待整個RDD計算結(jié)束，而是繼續(xù)進行union操作，這樣大大提高了計算的效率。

5、相關(guān)代碼

6、提交Stages

調(diào)度階段的提交，最終會被轉(zhuǎn)換成一個任務(wù)集的提交，DAGScheduler通過TaskScheduler接口提交任務(wù)集，這個任務(wù)集最終會觸發(fā)TaskScheduler構(gòu)建一個TaskSetManager的實例來管理這個任務(wù)集的生命周期，對于DAGScheduler來說，提交調(diào)度階段的工作到此就完成了。而TaskScheduler的具體實現(xiàn)則會在得到計算資源的時候，進一步通過TaskSetManager調(diào)度具體的任務(wù)到對應(yīng)的Executor節(jié)點上進行運算。

7、相關(guān)代碼

TaskSetManager負責管理TaskSchedulerImpl中一個單獨TaskSet，跟蹤每一個task，如果task失敗，負責重試task直到達到task重試次數(shù)的最多次數(shù)。

8、監(jiān)控Job、Task、Executor

DAGScheduler監(jiān)控Job與Task：要保證相互依賴的作業(yè)調(diào)度階段能夠得到順利的調(diào)度執(zhí)行，DAGScheduler需要監(jiān)控當前作業(yè)調(diào)度階段乃至任務(wù)的完成情況。這通過對外暴露一系列的回調(diào)函數(shù)來實現(xiàn)的，對于TaskScheduler來說，這些回調(diào)函數(shù)主要包括任務(wù)的開始結(jié)束失敗、任務(wù)集的失敗，DAGScheduler根據(jù)這些任務(wù)的生命周期信息進一步維護作業(yè)和調(diào)度階段的狀態(tài)信息。

DAGScheduler監(jiān)控Executor的生命狀態(tài)：TaskScheduler通過回調(diào)函數(shù)通知DAGScheduler具體的Executor的生命狀態(tài)，如果某一個Executor崩潰了，則對應(yīng)的調(diào)度階段任務(wù)集的ShuffleMapTask的輸出結(jié)果也將標志為不可用，這將導(dǎo)致對應(yīng)任務(wù)集狀態(tài)的變更，進而重新執(zhí)行相關(guān)計算任務(wù)，以獲取丟失的相關(guān)數(shù)據(jù)。

9、獲取任務(wù)執(zhí)行結(jié)果

結(jié)果DAGScheduler：一個具體的任務(wù)在Executor中執(zhí)行完畢后，其結(jié)果需要以某種形式返回給DAGScheduler，根據(jù)任務(wù)類型的不同，任務(wù)結(jié)果的返回方式也不同。

兩種結(jié)果，中間結(jié)果與最終結(jié)果：對于FinalStage所對應(yīng)的任務(wù)，返回給DAGScheduler的是運算結(jié)果本身，而對于中間調(diào)度階段對應(yīng)的任務(wù)ShuffleMapTask，返回給DAGScheduler的是一個MapStatus里的相關(guān)存儲信息，而非結(jié)果本身，這些存儲位置信息將作為下一個調(diào)度階段的任務(wù)獲取輸入數(shù)據(jù)的依據(jù)。

兩種類型，DirectTaskResult與IndirectTaskResult：根據(jù)任務(wù)結(jié)果大小的不同，ResultTask返回的結(jié)果又分為兩類，如果結(jié)果足夠小，則直接放在DirectTaskResult對象內(nèi)中，如果超過特定尺寸則在Executor端會將DirectTaskResult先序列化，再把序列化的結(jié)果作為一個數(shù)據(jù)塊存放在BlockManager中，然后將BlockManager返回的BlockID放在IndirectTaskResult對象中返回給TaskScheduler，TaskScheduler進而調(diào)用TaskResultGetter將IndirectTaskResult中的BlockID取出并通過BlockManager最終取得對應(yīng)的DirectTaskResult。

10、任務(wù)調(diào)度總體詮釋

責任編輯：未麗燕來源：加米谷大數(shù)據(jù)

Spark 大數(shù)據(jù)應(yīng)用程序

51CTO技術(shù)棧公眾號

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營

<optgroup id="hfz0n"><ruby id="hfz0n"></ruby></optgroup>