自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

【W(wǎng)OT2018】李明宇:在OpenStack云上運行大數(shù)據(jù)系統(tǒng)的難題與方法

原創(chuàng)
新聞 OpenStack
在5月19日上午舉行的“OpenStack創(chuàng)新實戰(zhàn)”分論壇中,OStorage (奧思數(shù)據(jù))創(chuàng)始人兼CTO李明宇將為大家?guī)眍}為《在OpenStack云上提供大數(shù)據(jù)服務(wù):問題、方法與實踐》的精彩演講。會前,51CTO記者有幸采訪了他,提前劇透下將要分享的重點內(nèi)容。

【51CTO.com原創(chuàng)稿件】七年一劍,華麗蛻變。自2012年起連續(xù)6年15場峰會,凝聚大量技術(shù)專家,博觀而約取,厚積而薄發(fā)。2018 WOT全球軟件與運維技術(shù)峰會揚帆起航,圍繞12大核心熱點,匯聚海內(nèi)外60位一線專家,打造高端技術(shù)盛宴!

在5月19日上午舉行的“OpenStack創(chuàng)新實戰(zhàn)”分論壇中,OStorage (奧思數(shù)據(jù))創(chuàng)始人兼CTO李明宇將為大家?guī)眍}為《在OpenStack云上提供大數(shù)據(jù)服務(wù):問題、方法與實踐》的精彩演講。會前,51CTO記者有幸采訪了他,提前劇透下將要分享的重點內(nèi)容。

OStorage (奧思數(shù)據(jù))創(chuàng)始人兼CTO/OpenStack社區(qū)布道師與貢獻者

OStorage (奧思數(shù)據(jù))創(chuàng)始人兼CTO/OpenStack社區(qū)布道師與貢獻者

李明宇是何許人也?在WOT峰會上,他將分享什么?

李明宇是OStorage創(chuàng)始人兼CTO,也是OpenStack社區(qū)布道師與貢獻者。在創(chuàng)立OStorage前,曾在中科院擔任課題組負責人,將云計算、分布式存儲等技術(shù)成功應(yīng)用在船舶、航天、國防等領(lǐng)域國家大型工程項目中。近年來,他積極研究和傳播OpenStack相關(guān)的云計算和云存儲技術(shù),多次在OpenStack Summit等國內(nèi)外大型會議上發(fā)表技術(shù)演講。

在本屆WOT峰會上,李明宇將結(jié)合Hadoop和Spark,包括Hive等SQL方案,講解在大數(shù)據(jù)系統(tǒng)云化實踐中可能會遇到的問題及解決方法。他還透露:“在分享中,我們將給參與互動的觀眾贈送我們翻譯并由電子工業(yè)出版社出版的《對象存儲:OpenStack Swift應(yīng)用、管理與開發(fā)》一書。”

他表示,之所以最終選定這個主題,是因為:雖然基于OpenStack的云環(huán)境部署量越來越多,但是很多OpenStack云環(huán)境并不提供大數(shù)據(jù)服務(wù),比如類似AWS的Elastic MapReduce,再比如面向大數(shù)據(jù)的SQL,支持OLAP等等。另外,隨著用戶業(yè)務(wù)逐步實現(xiàn)了云遷移,在云上部署大數(shù)據(jù)系統(tǒng)的需求已經(jīng)日益常見和迫切。

然而,由于大數(shù)據(jù)系統(tǒng)的特殊性,如果在云平臺上開一批虛機,然后像在物理機上做安裝部署那樣直接在這些虛機上部署運行Hadoop等大數(shù)據(jù)系統(tǒng),往往在性能、可靠性等各方面達不到預(yù)期。

但是,這并不能歸咎于虛擬化或者云平臺,而是需要采用正確的方法,這些問題都能夠迎刃而解,而且方法得當還能更好地利用虛擬化和云的敏捷性、彈性、容災(zāi)等優(yōu)勢,賦予大數(shù)據(jù)系統(tǒng)更多的能力。

“劇透”:在OpenStack云上運行大數(shù)據(jù)系統(tǒng)的方法

那么,在OpenStack云上運行大數(shù)據(jù)系統(tǒng)究竟有哪些方法?對此,李明宇表示,OpenStack基金會官方推薦了兩種方法:

***種方法是基于OpenStack服務(wù)組件Sahara實現(xiàn)。Sahara又稱之為OpenStack的EDP(Elastic Data Processing)服務(wù),它能夠很方便地幫用戶在OpenStack環(huán)境中部署和運行Hadoop、Spark等大數(shù)據(jù)系統(tǒng),對云環(huán)境的彈性也發(fā)揮得比較好,并且能夠很好地對接OpenStack的Swift對象存儲。

但是Sahara項目也有它的問題,比如支持的大數(shù)據(jù)系統(tǒng)類型有限,而且必須事先準備好節(jié)點鏡像,它不支持從S3讀寫數(shù)據(jù),對Hive和Pig的支持也有一定的限制。

假如沒有安裝Sahara,可以采用第二種方法,即是調(diào)用相關(guān)的API創(chuàng)建一批虛機(或者用容器也可以),并接入到云平臺的SDN網(wǎng)絡(luò)中,再用Ambari部署和配置Hadoop集群。這時候要注意的是,虛機的設(shè)置、組網(wǎng)方案要滿足大數(shù)據(jù)系統(tǒng)的需求,Ambari的配置要符合符合云環(huán)境的特點(具體怎樣做,會議當天會有詳細說明),更進一步,把上述過程用服務(wù)編排腳本,例如Heat腳本自動化。

值得說明的是,這種方法不僅僅適用于Hadoop、Spark,還可以用于其他各種大數(shù)據(jù)系統(tǒng)。它的缺點是用戶(云環(huán)境的End User)必須自己創(chuàng)建、管理虛機及其網(wǎng)絡(luò),并使用Ambari等工具安裝部署Hadoop集群,當然,IaaS云服務(wù)方也可以提供一些Heat模板的示例和虛機鏡像,減少用戶需要自己做的工作。

“劇透”不只一點: OpenStack云上提供大數(shù)據(jù)服務(wù)需留意存儲問題

談及在OpenStack云上運行大數(shù)據(jù)系統(tǒng)需要注意的問題,李明宇與記者分析說:“存儲是比較容易遇到的問題。”

現(xiàn)在有不少OpenStack云平臺采用分布式存儲作為虛擬機的塊存儲,提供云硬盤等服務(wù)。這些存儲系統(tǒng)本身有一定的冗余甚至三副本,一些大數(shù)據(jù)系統(tǒng)也自帶數(shù)據(jù)存儲組件,比如Hadoop中的HDFS。HDFS也常采用三副本或糾刪碼方式保證數(shù)據(jù)存儲的可靠性。如果直接創(chuàng)建虛擬機并安裝Hadoop(包括HDFS),則會出現(xiàn)存儲資源的浪費。有一種極端但卻很常見的情況:虛擬機塊存儲后端是采用了三副本的分布式存儲,HDFS又采用了三副本,最終導(dǎo)致存一份數(shù)據(jù)需要占用九份數(shù)據(jù)的空間,造成極大的浪費。此時,一個比較直接的想法是將HDFS的副本數(shù)量設(shè)為1,因為底層存儲已經(jīng)有冗余了,但這種做法會帶來新的問題,對虛擬化技術(shù)比較熟悉的工程師可能會想到直接讓虛擬機穿透去使用服務(wù)器的物理存儲硬盤,但這樣也會帶來一些其他問題。

實踐表明,用對象存儲是比較好的選擇。對象存儲屬于非常成熟的云服務(wù),不論是AWS還是OpenStack,最早推出的兩個服務(wù)里面均包含對象存儲。更重要的是,OpenStack Swift在支持大數(shù)據(jù)分析業(yè)務(wù)時,表現(xiàn)出了優(yōu)異的性能。OpenStack Swift還支持跨多個數(shù)據(jù)中心、多個地域構(gòu)建存儲集群,這就給用戶構(gòu)建跨數(shù)據(jù)中心的大數(shù)據(jù)系統(tǒng)帶來了便利,用戶在提交數(shù)據(jù)處理作業(yè)時,不用關(guān)心數(shù)據(jù)到底是存放在哪個數(shù)據(jù)中心的,而且可以一批任務(wù)處理多個數(shù)據(jù)中心的,甚至多個地域的數(shù)據(jù),比如跨北京、香港和北美。

據(jù)李明宇介紹,作為一家專注對象存儲的廠商,為了更好的為用戶提供對象存儲的服務(wù),圍繞OpenStack Swift,OStorage做了很多工作。OpenStack Swift是一個非常優(yōu)秀的分布式存儲系統(tǒng),它是OpenStack的六個核心項目之一,也是OpenStack最早的兩個項目之一,在國際上前幾年就已經(jīng)出現(xiàn)了百PB級規(guī)模的Swift對象存儲集群。在國內(nèi),美團、去哪兒、鳳凰網(wǎng)、順豐等諸多公司也都選擇了基于Swift實現(xiàn)對象存儲服務(wù)。

“但是OpenStack中缺少對Swift進行運維管理的組件,導(dǎo)致很多政企用戶在Swift的使用中遇到不少運維管理方面的問題。” 李明宇如是說。

考慮至此,OStorage開發(fā)了一套Swift的部署、運維和管理工具,幫助企業(yè)級和運營級用戶搭建高性能、高可靠和便于運維的Swift對象存儲集群。目前已經(jīng)用于電信、航天、銀行等多個領(lǐng)域客戶的生產(chǎn)環(huán)境。另外,OStorage還開發(fā)了一系列基于Swift的API擴展組件、應(yīng)用插件和數(shù)據(jù)遷移工具,幫助用戶更方便地應(yīng)用Swift對象存儲。

不只有“劇透”:談?wù)勚袊鳲penStack的發(fā)展

采訪***,作為OpenStack社區(qū)布道師與貢獻者,談起中國OpenStack的發(fā)展情況,李明宇表示,他從2013年開始參與OpenStack社區(qū),見證了OpenStack逐步被炒熱***趨于穩(wěn)定成熟走進各行各業(yè)的過程。目前,在國內(nèi)的金融、運營商、交通、政務(wù)、電力、科研等行業(yè),OpenStack得到了非常廣泛的應(yīng)用。可以說,我們?nèi)粘R率匙⌒?、科教文衛(wèi)、工業(yè)國防……處處都有OpenStack在后臺支持著。

隨著騰訊云這樣的一線大企業(yè)榮獲OpenStack Superuser大獎以及成為OpenStack基金會白金會員,國內(nèi)的OpenStack生態(tài)也發(fā)展到了一個新的高度。

OpenStack本身和OpenStack基金會支持的KataContainer等新的項目未來的定位是"開放基礎(chǔ)設(shè)施(Open Infrastructure)",將繼續(xù)加強和擴展包括虛機、容器、SDN、分布式存儲等IT基礎(chǔ)設(shè)施方面的工作,并且讓這些基礎(chǔ)設(shè)施更好地支持云應(yīng)用的運行。

【51CTO原創(chuàng)稿件,合作站點轉(zhuǎn)載請注明原文作者和出處為51CTO.com】

責任編輯:藍雨淚 來源: 51CTO.com
相關(guān)推薦

2016-04-13 11:36:33

OpenStackWOT2016云計算

2018-03-23 17:35:21

WOT2018董明鑫Docker

2018-05-19 15:04:11

WOT2018OpenStackAR

2018-05-18 22:07:27

WOT2018前端AIOps

2018-12-24 11:13:32

WOT2018AI人工智能

2019-11-15 14:46:25

祼機大數(shù)據(jù)分析

2018-06-15 09:59:02

WOT史揚邊緣計算

2018-12-18 11:17:14

人工智能WOT2018AI工具

2018-05-31 17:19:24

前端H5云端

2018-03-29 11:34:54

WOT算法美團

2018-12-18 08:59:41

WOT2018

2018-06-21 11:40:51

AR開發(fā)

2018-06-26 10:41:50

物聯(lián)網(wǎng)制造

2018-06-25 16:14:28

AI人工智能貝殼找房

2018-06-27 15:39:31

2018-06-14 21:47:46

WOT沈劍58速運

2018-04-02 09:14:10

人工智能鏈家WOT2018

2018-03-24 12:21:21

58速運微服務(wù)架構(gòu)智能云

2018-05-07 10:30:41

2016-03-23 16:02:09

CIO時代網(wǎng)
點贊
收藏

51CTO技術(shù)棧公眾號