自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Alluxio發(fā)布新版本V1.8,加速數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的云端部署

企業(yè)動(dòng)態(tài)
云端逐漸成為大數(shù)據(jù)企業(yè)的必爭(zhēng)之地。根據(jù)美國(guó)媒體報(bào)道,7月31日消息,分布式虛擬存儲(chǔ)系統(tǒng)Alluxio發(fā)布1.8版本,加速針對(duì)數(shù)據(jù)分析及機(jī)器學(xué)習(xí)的云端部署。

 云端逐漸成為大數(shù)據(jù)企業(yè)的必爭(zhēng)之地。根據(jù)美國(guó)媒體報(bào)道,7月31日消息,分布式虛擬存儲(chǔ)系統(tǒng)Alluxio發(fā)布1.8版本,加速針對(duì)數(shù)據(jù)分析及機(jī)器學(xué)習(xí)的云端部署。

Alluxio是世界上***能以內(nèi)存級(jí)速度集成數(shù)據(jù)的軟件系統(tǒng),其技術(shù)脫胎于其創(chuàng)始人李浩源博士在加州伯克利AMPLab的博士課題開源研究項(xiàng)目Tachyon——它能夠在大數(shù)據(jù)應(yīng)用層及存儲(chǔ)層之間搭建一個(gè)虛擬數(shù)據(jù)層,讓企業(yè)能夠利用這個(gè)系統(tǒng)來(lái)使用和管理不同的數(shù)據(jù)應(yīng)用及存儲(chǔ)方案。此前,全球知名的現(xiàn)象級(jí)開源軟件Spark及Mesos同樣出自AMPLab,只是不同于針對(duì)存儲(chǔ)的Alluxio,前者專注于計(jì)算,后者則專注于資源管理和調(diào)度。

blob.png

由于擁有內(nèi)存級(jí)的訪問速度,Alluxio系統(tǒng)比過去的方案快了十倍甚至數(shù)十倍。

創(chuàng)建五年后,Alluxio是最活躍的數(shù)據(jù)生態(tài)系統(tǒng)開源項(xiàng)目之一,解決數(shù)據(jù)問題的能力備受信任。在中國(guó)市值排名前十的互聯(lián)網(wǎng)公司中,已經(jīng)有八家在應(yīng)用Alluxio的技術(shù)方案,管理PB級(jí)別的數(shù)據(jù)。除此之外,華為、聯(lián)想、中國(guó)電信、京東等公司也都在用它來(lái)管理數(shù)據(jù),其他合作伙伴包括英特爾、三星、微軟、Nvidia、Oracle等等。

Alluxio經(jīng)歷了數(shù)次版本更替。通過此次更新,這個(gè)系統(tǒng)希望能進(jìn)一步支持不同的云端存儲(chǔ)方案,加速數(shù)據(jù)儲(chǔ)存、調(diào)取和使用的速度,解決深度學(xué)習(xí)面臨的數(shù)據(jù)存儲(chǔ)問題;與此同時(shí),給他們非常重視的開源社區(qū)提供更多的支持和幫助。

針對(duì)云端部署,Alluxio的新版本提供了三個(gè)全新的功能:

1. 感知定位數(shù)據(jù)管理工具。企業(yè)可以為數(shù)據(jù)應(yīng)用設(shè)置不同的策略,根據(jù)數(shù)據(jù)的位置標(biāo)記來(lái)選定具體的數(shù)據(jù)調(diào)用區(qū)域或者優(yōu)化數(shù)據(jù)分布,從而降低調(diào)用不同存儲(chǔ)位置的數(shù)據(jù)時(shí)的成本、提高效率。

2. 針對(duì)不同云端存儲(chǔ)方案的優(yōu)化。解決對(duì)象存儲(chǔ)或者云端存儲(chǔ)方案和傳統(tǒng)的HDFS(Hadoop Distributed File System)方案中的API及執(zhí)行效率的差別帶來(lái)的問題;也讓把數(shù)據(jù)從HDFS轉(zhuǎn)移到對(duì)象存儲(chǔ)時(shí)更加容易,真正做到在云端輕便地轉(zhuǎn)移數(shù)據(jù)。

3. FUSE(Filesystem in Userspace)界面。FUSE能把云上的數(shù)據(jù)緩存在本地,通過普通的本地文件夾展現(xiàn),以無(wú)縫支持現(xiàn)有的機(jī)器學(xué)習(xí)和大數(shù)據(jù)分析框架來(lái)存取云端數(shù)據(jù)。

云端趨勢(shì)下,混合云部署的強(qiáng)大需求

此次Alluxio版本更新,可以說是順應(yīng)了企業(yè)“往云上走”的趨勢(shì)。

近幾年,不僅有層出不窮的云端數(shù)據(jù)存儲(chǔ)、計(jì)算和分析創(chuàng)業(yè)項(xiàng)目提供服務(wù),大公司也在尋求更好的云端部署方案。

2018年6月,微軟收購(gòu)知名開源開發(fā)平臺(tái)GitHub后,并表示將進(jìn)行GitHub與自己的云服務(wù)產(chǎn)品Azure Cloud的整合。分析報(bào)告預(yù)測(cè),未來(lái)云服務(wù)市場(chǎng)將從今年的281億美元增長(zhǎng)到2021年的533億美元。

“數(shù)據(jù)分析和機(jī)器學(xué)習(xí)的興起讓云端的計(jì)算量大量增長(zhǎng),Alluxio的特性意味著它同樣可以很好地管理混合云的數(shù)據(jù)。”李浩源對(duì)鈦媒體說道。451Research的報(bào)告顯示,預(yù)計(jì)在2019年,超過66%的企業(yè)會(huì)使用一個(gè)混合云或者多個(gè)云服務(wù)方案的架構(gòu),它們都可能面對(duì)不同云服務(wù)上迥異的操作差異,單憑自己很難保證效率,需要第三方服務(wù)方案的協(xié)助。

更遠(yuǎn)的未來(lái)里,中小型企業(yè)可能會(huì)徹底轉(zhuǎn)向公有云部署。

Gartner預(yù)測(cè),到2021年,全球超過50%的企業(yè)會(huì)應(yīng)用純粹的公有云存儲(chǔ)方案,而更大的公司則會(huì)應(yīng)用更多的第三方云端基礎(chǔ)架構(gòu)來(lái)管理混合云。

這和李浩源的判斷相符。他認(rèn)為,對(duì)于很多現(xiàn)代企業(yè)來(lái)說真正的價(jià)值往往在數(shù)據(jù)里。

尤其是對(duì)于某些大型企業(yè)來(lái)說,最核心的數(shù)據(jù)管理很難假手于人。2017年馬云接受Bloomberg專訪時(shí)曾說出金句,“數(shù)據(jù)的重要程度堪比上個(gè)世紀(jì)的石油。”

blob.png

Eric Anderson(時(shí)任Google產(chǎn)品經(jīng)理)談Alluxio

“總有一些數(shù)據(jù)他們希望保存在本地服務(wù)器上,但全部放在本地成本又太高,所以選折中方案,在一個(gè)無(wú)縫的架構(gòu)下管理私有和公有云是一個(gè)剛需。”李浩源說道。

除此之外,Alluxio也希望能解決近幾年火熱的數(shù)據(jù)分析及深度學(xué)習(xí)面臨的數(shù)據(jù)存儲(chǔ)問題。

對(duì)于數(shù)據(jù)分析來(lái)說,已經(jīng)有了不少使用云上數(shù)據(jù)的方案,Alluxio只是能幫助提高性能、降低費(fèi)用。

對(duì)于深度學(xué)習(xí),問題則稍顯復(fù)雜。

“不是所有的訓(xùn)練數(shù)據(jù)都能直接用于像Tensorflow這種深度學(xué)習(xí)框架,另外各類分布式存儲(chǔ)和云存儲(chǔ)的交互方式和傳統(tǒng)本地交互方式有很大區(qū)別,用戶難以準(zhǔn)確地配置和使用新工具。”舉個(gè)例子,沒有Alluxio時(shí),讓深度學(xué)習(xí)框架TensorFlow訪問微軟云服務(wù)Azure Object store上的數(shù)據(jù)就是一件難以完成的事情。

Alluxio的特性意味著它能整合各類存儲(chǔ)系統(tǒng),縮短各類深度學(xué)習(xí)框架與存儲(chǔ)層之間的距離,提高效率及彈性、降低成本。另一方面,這次更新里的FUSE工具則讓Alluxio可以掛載本地文件系統(tǒng),讓用戶在使用遠(yuǎn)程云端分布式存儲(chǔ)時(shí),擁有和本地?cái)?shù)據(jù)時(shí)相似的交互體驗(yàn)。

關(guān)注開源社區(qū)

除了針對(duì)云端部署及深度學(xué)習(xí)的更新之外,Alluxio的新版本還有另一個(gè)重點(diǎn):為開發(fā)者提供了更多便利,包括:

1. 提供針對(duì)應(yīng)用運(yùn)行的數(shù)據(jù)服務(wù)監(jiān)視工具,包括能夠獲取集群實(shí)時(shí)數(shù)據(jù)的web圖形界面以及命令行界面(Command Line Interface)工具,讓開發(fā)者能夠更好地了解數(shù)據(jù)的使用情況、分析性能結(jié)果并獲得數(shù)據(jù)洞察。

2. 更完善的生態(tài)系統(tǒng)集成。把對(duì)數(shù)據(jù)服務(wù)的追蹤和洞察擴(kuò)展到不同的應(yīng)用層和存儲(chǔ)層,開發(fā)者可以通過新的工具直觀地看到存儲(chǔ)系統(tǒng)中的問題,比如延時(shí)的直方圖和存儲(chǔ)空間利用率。

3. 一個(gè)入門套件(Starter Kit),其中包括預(yù)建的代碼及其他文件和一些簡(jiǎn)單的案例展示,包括“如何在本地機(jī)器上安裝Alluxio”“如何安裝和設(shè)置AWS S3 Bucket(存儲(chǔ)桶)及加速遠(yuǎn)程讀取”,讓開發(fā)者能更快地上手并使用Alluxio。

“開源社區(qū)是我們最珍視的事情之一,所以希望盡可能地幫助開發(fā)者理解和使用這個(gè)系統(tǒng)。”李浩源說道。他認(rèn)為,自創(chuàng)立之初,這一社區(qū)帶來(lái)的活力是推動(dòng)Alluxio迅速進(jìn)展的重要推力之一。

在2016年接受CSDN采訪時(shí),Alluxio曾表示“Alluxio是史上成長(zhǎng)速度最快的開源社區(qū)之一”,如今其貢獻(xiàn)者已經(jīng)超過800人,在GitHub上星標(biāo)超過3000個(gè)。

[[239722]]

正在比賽氣泡足球的部分Alluxio團(tuán)隊(duì)成員

這個(gè)項(xiàng)目里還有不少活躍的公司貢獻(xiàn)者,他們還能提供針對(duì)具體產(chǎn)品和應(yīng)用場(chǎng)景的反饋。英特爾、騰訊、阿里巴巴、百度、京東、陌陌等公司同樣也是這個(gè)開源項(xiàng)目的貢獻(xiàn)者之一 。比如陌陌的工程師團(tuán)隊(duì)會(huì)基于陌陌的應(yīng)用場(chǎng)景,做出適配和調(diào)整,而后經(jīng)過Alluxio的社區(qū)管理者審核后接納,“最終形成一個(gè)正向的反饋,是一個(gè)雙向改進(jìn)的過程”。

百度、去哪兒和陌陌都曾經(jīng)就應(yīng)用Alluxio之后的經(jīng)驗(yàn)做出分享,比如百度此前分享過,在用他們自己開發(fā)的使用Spark SQL作為計(jì)算引擎的查詢系統(tǒng)時(shí),單獨(dú)一次查詢需要100-150秒;加上作為內(nèi)存中心的存儲(chǔ)層的Alluxio之后,數(shù)據(jù)可能會(huì)沖擊本地或遠(yuǎn)程Alluxio節(jié)點(diǎn),需要10-15秒;當(dāng)所有數(shù)據(jù)儲(chǔ)存在Alluxio本地時(shí),平均只需5秒,速度提升了30倍。測(cè)試過后,百度圍繞 Alluxio和Spark SQL建立了一個(gè)完整的系統(tǒng)。

2016年初,Alluxio曾獲得硅谷知名風(fēng)險(xiǎn)投資機(jī)構(gòu) Andressen Horowitz的750萬(wàn)美元融資。

責(zé)任編輯:張燕妮 來(lái)源: 互聯(lián)網(wǎng)
相關(guān)推薦

2018-05-23 08:39:18

AlluxioCeph對(duì)象存儲(chǔ)

2009-06-17 09:24:34

學(xué)習(xí)strutsStruts新版本

2014-11-04 15:09:02

2014-08-27 16:01:05

AppDynamics

2020-10-26 21:07:49

GDBGNUC語(yǔ)言

2019-06-12 10:01:10

華勝天成

2013-09-02 15:04:25

QQ高仿版GG嘰嘰

2014-04-17 11:24:44

GoogleAndroid

2023-05-05 06:19:30

版本Windows 11企業(yè)版

2009-12-29 13:43:21

Ubuntu 9.10

2013-12-04 16:19:39

2010-04-13 09:38:19

Office Mac

2009-05-15 17:29:19

微軟托管服務(wù)引擎MSE

2015-12-02 10:52:17

無(wú)線滲透無(wú)線安全Xiaopan OS

2017-05-10 14:27:29

靜態(tài)代碼漏洞安全

2011-08-01 15:35:51

GlassFishJava 7

2022-12-12 12:47:39

2012-02-23 13:51:11

X3.1
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)