自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

EnginePlus受邀參加亞馬遜云科技中國峰會 分享Spark on Amazon EKS實踐經(jīng)驗

企業(yè)動態(tài) Spark
亞馬遜云科技中國峰會在上海召開。亞馬遜云科技的眾多技術(shù)合作伙伴受邀出席峰會,圍繞“構(gòu)建新格局,重塑云時代”的主題,進行了系列主題演講和產(chǎn)品展示,分享云計算領(lǐng)域的先進技術(shù)經(jīng)驗與企業(yè)成功實踐。

 近日,亞馬遜云科技中國峰會在上海召開。亞馬遜云科技的眾多技術(shù)合作伙伴受邀出席峰會,圍繞“構(gòu)建新格局,重塑云時代”的主題,進行了系列主題演講和產(chǎn)品展示,分享云計算領(lǐng)域的先進技術(shù)經(jīng)驗與企業(yè)成功實踐。

Mobvista匯量科技資深架構(gòu)師、EnginePlus產(chǎn)品負責(zé)人陳緒也來到現(xiàn)場,與嘉賓們分享了在Amazon Elastic Kubernetes Service (Amazon EKS) 上部署Spark的干貨經(jīng)驗,并以Mobvista匯量科技自身為例,介紹了Spark on Amazon EKS的業(yè)務(wù)實踐成果。

Spark on EKS: 業(yè)務(wù)增長帶來挑戰(zhàn)

記者了解到,Spark 作為廣泛應(yīng)用的大數(shù)據(jù)處理框架,提供了豐富的Data Frame接口以及SQL查詢的功能,同時也可以通過PySpark對接深度學(xué)習(xí)框架。據(jù)悉,匯量科技使用的Spark集群承擔(dān)了大規(guī)模ETL、數(shù)據(jù)處理分析、Ad-hoc查詢,以及算法模型訓(xùn)練的重要任務(wù),現(xiàn)在離線計算集群有上萬CPU核心,每日處理PB級的數(shù)據(jù)。

陳緒介紹道,其團隊最初采用HDP,在EC2上搭建了彈性的Hadoop服務(wù),但隨著業(yè)務(wù)規(guī)模的發(fā)展,更多的挑戰(zhàn)開始顯現(xiàn):一方面,團隊希望各業(yè)務(wù)線之間可實現(xiàn)資源隔離,同時具備高效的彈性能力,以保障業(yè)務(wù)產(chǎn)出時效性;另一方面,系統(tǒng)遇到大規(guī)模的臨時查詢作業(yè)時,查詢數(shù)據(jù)量可達數(shù)十TB,這給集群的彈性伸縮帶來了很大壓力。對此,陳緒表示:“彈性伸縮的效率影響著作業(yè)執(zhí)行時間和總體成本。因此,我們通過調(diào)研,開始嘗試通過容器化的架構(gòu)來解決上述問題。

匯量科技業(yè)務(wù)實踐成果:EnginePlus

陳緒介紹稱,團隊選擇了Amazon EKS服務(wù)來搭建容器化Spark計算平臺:“將不同的組件劃分到若干不同的NodeGroup,包括Spark Driver、Spark Executor,以及Zeppelin、Jupyter的Notebook”,從而為不同類型的節(jié)點組配置不同的資源類型,并分別實現(xiàn)彈性伸縮,獲得更好的性價比。

提到EC2 機型選擇時,陳緒表示,對于大規(guī)模shuffle的作業(yè),磁盤的IOPS和讀寫吞吐要求都很高,因此在大規(guī)模ETL集群中,團隊會優(yōu)先選擇M5d、C5d、R5d等帶有本地nvme磁盤的機型。在陳緒團隊的生產(chǎn)集群上,IOPS可達到萬級別,讀寫吞吐可以達到GB級別,而使用本地nvme磁盤機型,可以很好地解決磁盤性能瓶頸問題。此外,陳緒還從資源管理、作業(yè)狀態(tài)和日志、版本和部分 bug修復(fù)等角度進一步探討了Spark on Amazon EKS的業(yè)務(wù)實踐,并為來賓們介紹了一系列技術(shù)實踐的成果——匯量科技自研的一站式云原生大數(shù)據(jù)和人工智能平臺EnginePlus。

據(jù)了解,EnginePlus 將數(shù)據(jù)湖、計算分析、人工智能集成在統(tǒng)一平臺上,提供面向多種業(yè)務(wù)場景的實時數(shù)據(jù)湖框架 StarLake、機器學(xué)習(xí)框架 MindAlpha 等自研開源工具,并能夠與 Spark 計算框架深度集成,其適用場景包括互聯(lián)網(wǎng)金融、出海電商、移動廣告等。

陳緒介紹稱,在亞馬遜S3存儲和EKS之上,EnginePlus部署了StarLake數(shù)據(jù)湖框架和Spark云原生計算框架,從而形成了湖倉一體的統(tǒng)一計算引擎。在天級大作業(yè)的遷移中,與Yarn相比,在Amazon EKS上部署Spark后,作業(yè)耗時大幅縮短。同時EnginePlus也針對容器化環(huán)境做了很多bug修復(fù)和易用性提升的開發(fā)工作,幫助用戶更好更方便地在云上使用EnginePlus。

目前,EnginePlus已經(jīng)上線亞馬遜云科技Marketplace,助力全球企業(yè)實現(xiàn)新一代數(shù)據(jù)智能開發(fā),解放業(yè)務(wù)生產(chǎn)力。未來,EnginePlus 將與亞馬遜云科技攜手并進,以其云原生、一站式數(shù)據(jù)智能的服務(wù),賦能更多用戶。

責(zé)任編輯:趙立京 來源: 大京網(wǎng)
相關(guān)推薦

2013-08-29 16:49:10

2022-08-10 13:54:40

云存儲存儲私有云

2010-01-05 13:16:59

2021-07-27 10:32:45

匯量科技SpotMax

2016-12-07 10:41:03

2015-06-03 14:14:17

dockeropenstackIaaS

2022-10-18 09:54:17

2021-06-01 16:52:27

AI

2022-08-02 13:53:53

亞馬遜云科技WAN網(wǎng)絡(luò)運維

2021-03-01 16:38:39

亞馬遜云科技Amazon Look

2023-06-07 14:19:27

2015-08-10 14:11:48

亞馬遜AWS中國Amazon S3

2021-04-01 14:26:09

亞馬遜云科技Amazon Pers

2017-05-16 17:32:32

云棲大會成都阿里云

2013-10-10 13:50:02

智能交通華為

2014-10-29 13:52:38

程序員

2022-12-12 15:38:22

亞馬遜云科技
點贊
收藏

51CTO技術(shù)棧公眾號