自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

<em id="yrcht"><rt id="yrcht"></rt></em>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

WOT技術(shù)大會(huì)

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

Flink 提交模式，你了解多少？

作者：左右 2021-12-09 07:47:58

開(kāi)發(fā) 架構(gòu)

此篇以先以了解flink組件開(kāi)始，再以簡(jiǎn)單模式Local 和 Standlone 正式進(jìn)入正題。本篇主要是以Yarn 方式下三種模式展開(kāi)細(xì)講，當(dāng)然還有Kubernetes方式（本篇不細(xì)說(shuō)）。

[[439440]]

前言

寫(xiě)這種文章的初衷就是，在開(kāi)發(fā)的過(guò)程中不知道怎么去選擇，各種模式不是太充分了解?，F(xiàn)在花點(diǎn)時(shí)間去找資料研究對(duì)比了一番，所以出此篇。

此篇以先以了解flink組件開(kāi)始，再以簡(jiǎn)單模式Local 和 Standlone 正式進(jìn)入正題。本篇主要是以Yarn 方式下三種模式展開(kāi)細(xì)講，當(dāng)然還有Kubernetes方式(本篇不細(xì)說(shuō))。

組件

在了解提交模式之前，先了解一下Flink組件與組件之間的協(xié)作關(guān)系。

資源管理器(Resource Manager)

(1)主要負(fù)責(zé)管理任務(wù)管理器TaskManager的插槽slot。

(2) 當(dāng)作業(yè)管理器JM申請(qǐng)插槽資源時(shí)， RM會(huì)將有空閑插槽的TM分配給JM。如果 RM沒(méi)有足夠的插槽來(lái)滿足JM的請(qǐng)求。

(3)它還可以向資源提供平臺(tái)發(fā)起會(huì)話，以提供啟動(dòng) TM進(jìn)程的容器。

作業(yè)管理器(JobManager)

(1) 控制一個(gè)應(yīng)用程序執(zhí)行的主進(jìn)程，也就是說(shuō)，每個(gè)應(yīng)用程序都會(huì)被一個(gè)不同的JM所控制執(zhí)行。

(2) JM會(huì)先接收到要執(zhí)行的應(yīng)用程序，這個(gè)應(yīng)用程序會(huì)包括：作業(yè)圖(Job Graph)、邏輯數(shù)據(jù)流圖( ogical dataflow graph)和打包了所有的類(lèi)、庫(kù)和其它資源的JAR包。

(3) JM會(huì)把 Jobgraph轉(zhuǎn)換成一個(gè)物理層面的數(shù)據(jù)流圖，這個(gè)圖被叫做 “執(zhí)行圖”(Executiongraph),包含了所有可以并發(fā)執(zhí)行的任務(wù)。Job Manager會(huì)向資源管理器( Resourcemanager)請(qǐng)求執(zhí)行任務(wù)必要的資源，也就是任務(wù)管理器(Taskmanager)上的插槽slot。一旦它獲取到了足夠的資源，就會(huì)將執(zhí)行圖分發(fā)到真正運(yùn)行它們的TM上。而在運(yùn)行過(guò)程中JM會(huì)負(fù)責(zé)所有需要中央?yún)f(xié)調(diào)的操作，比如說(shuō)檢查點(diǎn)(checkpoints)的協(xié)調(diào)。

任務(wù)管理器(Taskmanager)

(1) Flink中的工作進(jìn)程。通常在 Flink中會(huì)有多個(gè)TM運(yùn)行，每個(gè)TM都包含了一定數(shù)量的插槽slots。插槽的數(shù)量限制了TM能夠執(zhí)行的任務(wù)數(shù)量。

(2) 啟動(dòng)之后，TM會(huì)向資源管理器注冊(cè)它的插槽;收到資源管理器的指令后， TM就會(huì)將一個(gè)或者多個(gè)插槽提供給JM調(diào)用。TM就可以向插槽分配任務(wù)tasks來(lái)執(zhí)行了。

(3) 在執(zhí)行過(guò)程中，一個(gè)TM可以跟其它運(yùn)行同一應(yīng)用程序的TM交換數(shù)據(jù)。

分發(fā)器(Dispatcher)

(1)可以跨作業(yè)運(yùn)行，它為應(yīng)用提交提供了REST接口。

(2)當(dāng)一個(gè)應(yīng)用被提交執(zhí)行時(shí)，分發(fā)器就會(huì)啟動(dòng)并將應(yīng)用移交給JM。

(3)Dispatcher他會(huì)啟動(dòng)一個(gè) WebUi，用來(lái)方便地展示和監(jiān)控作業(yè)執(zhí)行的信息。

Local模式

JobManager 和 TaskManager 共用一個(gè) JVM,只需要jdk支持，單節(jié)點(diǎn)運(yùn)行，主要用來(lái)調(diào)試。

Standlone模式

Standlone 是Flink自帶的一個(gè)分布式集群，它不依賴其他的資源調(diào)度框架、不依賴yarn 等。

充當(dāng)Master角色的是JobManager。

充當(dāng)Slave/Worker角色是TaskManager

配置與啟動(dòng)

(1)conf 目錄下有兩個(gè)文件：masters 和 workers 指定地址。

(2)需要配置 conf/flink-conf.yaml 的自行配置。

(3)分發(fā)各個(gè)機(jī)器。

(4)啟動(dòng)集群 bin/start-cluster.sh

(5)提交任務(wù) flink run

Yarn 模式

首先認(rèn)識(shí)下提交流程

(1)提交App之前，先上傳Flink的Jar包和配置到HDFS，以便JobManager和TaskManager共享HDFS的數(shù)據(jù)。

(2)客戶端向ResourceManager提交Job，ResouceManager接到請(qǐng)求后，先分配container資源，然后通知NodeManager啟動(dòng)ApplicationMaster。

(3)ApplicationMaster會(huì)加載HDFS的配置，啟動(dòng)對(duì)應(yīng)的JobManager，然后JobManager會(huì)分析當(dāng)前的作業(yè)圖，將它轉(zhuǎn)化成執(zhí)行圖(包含了所有可以并發(fā)執(zhí)行的任務(wù))，從而知道當(dāng)前需要的具體資源。

(4)接著，JobManager會(huì)向ResourceManager申請(qǐng)資源，ResouceManager接到請(qǐng)求后，繼續(xù)分配container資源，然后通知ApplictaionMaster啟動(dòng)更多的TaskManager(先分配好container資源，再啟動(dòng)TaskManager)。container在啟動(dòng)TaskManager時(shí)也會(huì)從HDFS加載數(shù)據(jù)。

(5)TaskManager啟動(dòng)后，會(huì)向JobManager發(fā)送心跳包。JobManager向TaskManager分配任務(wù)。

Session Mode

Session模式提前初始化好一個(gè)集群，然后向這個(gè)集群提交應(yīng)用。所有應(yīng)用都在同一個(gè)集群中執(zhí)行，共享資源。這里JobManager僅有一個(gè)。提交到這個(gè)集群的作業(yè)可以直接運(yùn)行。如圖所示

Session模式共享Dispatcher 和 ResourceManager，作業(yè)共享集群資源。

Session多個(gè)作業(yè)之間又不是隔離的，如果有一個(gè)TaskManager掛掉，它上面承載著的所有作業(yè)也會(huì)失敗。同樣來(lái)說(shuō)，啟動(dòng)的Job任務(wù)越多，JobManager的負(fù)載也就越大。

所以，Session模式適合生命周期短資源消耗低的場(chǎng)景。

提交

./bin/flink run -t yarn-session \ 
  -Dyarn.application.id=application_XXXX_YY \ 
  ./examples/streaming/TopSpeedWindowing.jar

Per-Job Cluster Mode

在Per-Job模式下，每個(gè)提交到Y(jié)ARN上的作業(yè)會(huì)有單獨(dú)的Flink集群，擁有專(zhuān)屬的JobManager和TaskManager。也即:一個(gè)作業(yè)一個(gè)集群，作業(yè)之間相互隔離。

以Per-Job模式提交作業(yè)的啟動(dòng)延遲可能會(huì)較高，因?yàn)椴恍枰蚕砑?，所以在PipelineExecutor中執(zhí)行作業(yè)提交的時(shí)候，創(chuàng)建集群并將JobGraph以及所需要的文件等一同提交給Yarn集群，進(jìn)行一系列的初始化動(dòng)作，這個(gè)時(shí)候需要些時(shí)間。提交任務(wù)的時(shí)候會(huì)把本地flink的所有jar包先上傳到hdfs上相應(yīng)的臨時(shí)目錄，這個(gè)也會(huì)帶來(lái)大量的網(wǎng)絡(luò)的開(kāi)銷(xiāo)。

優(yōu)點(diǎn)就是作業(yè)之間的資源完全隔離，一個(gè)作業(yè)的TaskManager失敗不會(huì)影響其他作業(yè)的運(yùn)行，JobManager的負(fù)載也是分散開(kāi)來(lái)的，不存在單點(diǎn)問(wèn)題。當(dāng)作業(yè)運(yùn)行完成，與它關(guān)聯(lián)的集群也就被銷(xiāo)毀，資源被釋放。

所以，Per-Job模式一般用來(lái)部署那些長(zhǎng)時(shí)間運(yùn)行的作業(yè)。

提交

/bin/flink run -t yarn-per-job --detached ./examples/streaming/TopSpeedWindowing.jar

「其他操作」

# List running job on the cluster 
./bin/flink list -t yarn-per-job -Dyarn.application.id=application_XXXX_YY 
# Cancel running job 
./bin/flink cancel -t yarn-per-job -Dyarn.application.id=application_XXXX_YY <jobId>

Application Mode

Application 模式嘗試去將per-job 模式的資源隔離性和輕量級(jí)，可擴(kuò)展的應(yīng)用提交進(jìn)程相結(jié)合。為了實(shí)現(xiàn)這個(gè)目的，它會(huì)每個(gè)Job 創(chuàng)建一個(gè)集群，但是應(yīng)用的main()將被在JobManager 執(zhí)行。

Application 模式為每個(gè)提交的應(yīng)用程序創(chuàng)建一個(gè)集群，該集群可以看作是在特定應(yīng)用程序的作業(yè)之間共享的會(huì)話集群，并在應(yīng)用程序完成時(shí)終止。在這種體系結(jié)構(gòu)中Application模式在不同應(yīng)用之間提供了資源隔離和負(fù)載平衡保證

在JobManager 中執(zhí)行main()方法，可以節(jié)省所需的CPU周期。還有個(gè)好處就是，由于每個(gè)應(yīng)用程序有一個(gè)JobManager，因此可以更平均地分散網(wǎng)絡(luò)負(fù)載。

提交

./bin/flink run-application -t yarn-application ./examples/streaming/TopSpeedWindowing.jar

「其他操作」

# List running job on the cluster 
./bin/flink list -t yarn-application -Dyarn.application.id=application_XXXX_YY 
# Cancel running job 
./bin/flink cancel -t yarn-application -Dyarn.application.id=application_XXXX_YY <jobId>

Application mode中的多個(gè)job，實(shí)際在代碼上的表現(xiàn)就是能夠允許在一個(gè)Application里面調(diào)用多次execute/executeAsyc方法。但是execute方法會(huì)被阻塞，也就是只有一個(gè)job完成之后才能繼續(xù)下一個(gè)job的execute，但是可以通過(guò)executeAsync進(jìn)行異步非阻塞執(zhí)行。

Yarn 模式總結(jié)

模式	生命周期	資源隔離	優(yōu)點(diǎn)	缺點(diǎn)	main方法
Session	關(guān)閉會(huì)話,才會(huì)停止	共用JM和TM	預(yù)先啟動(dòng)，啟動(dòng)作業(yè)不再啟動(dòng)。資源充分共享	資源隔離比較差，TM不容易擴(kuò)展	在客戶端執(zhí)行
Per-job	Job停止，集群停止	單個(gè)Job獨(dú)享JM和TM	充分隔離，資源根據(jù)job按需申請(qǐng)	job啟動(dòng)慢,每個(gè)job需要啟動(dòng)一個(gè)JobManager	在客戶端執(zhí)行
Application	當(dāng)Application全部執(zhí)行完，集群才會(huì)停止	Application使用一套JM和TM	Client負(fù)載低，Application之間實(shí)現(xiàn)資源隔離，Application內(nèi)實(shí)現(xiàn)資源共享	對(duì)per-job模式和session模式的優(yōu)化部署模式(優(yōu)點(diǎn))	在Cluster中

責(zé)任編輯：武曉燕來(lái)源：大數(shù)據(jù)左右手

Flink 提交模式

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<sub id="eyw0w"><p id="eyw0w"></p></sub>