自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

Alluxio數(shù)據(jù)編排平臺進(jìn)一步深化對人工智能和機(jī)器學(xué)習(xí)工作負(fù)載在混合云和多云上的支持

存儲 混合云
新功能極大地提高了人工智能和機(jī)器學(xué)習(xí)模型訓(xùn)練中數(shù)據(jù)加載和預(yù)處理的I/O效率,降低端到端的訓(xùn)練時間和成本

   今日,全球首創(chuàng)的開源數(shù)據(jù)編排軟件開發(fā)商Alluxio宣布正式發(fā)布數(shù)據(jù)編排平臺2.7版本,新版本立即可用。2.7版本通過并行數(shù)據(jù)加載、數(shù)據(jù)預(yù)處理和訓(xùn)練工作流,可將機(jī)器學(xué)習(xí)(ML)訓(xùn)練的I/O效率提高8-12倍,從而顯著降低成本。新版本還提供了更強(qiáng)的性能分析,并能更好地支持Apache Hudi和Iceberg等開放表格格式,使得對數(shù)據(jù)湖的訪問更易于擴(kuò)展,從而實(shí)現(xiàn)了Presto和Spark的分析提速。

  “Alluxio 2.7版本進(jìn)一步鞏固了Alluxio在云上人工智能(AI)、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方面的重要地位,”Alluxio創(chuàng)始人兼首席執(zhí)行官李浩源表示。“隨著數(shù)據(jù)集的增長以及CPU和GPU計(jì)算能力的增強(qiáng),機(jī)器學(xué)習(xí)和深度學(xué)習(xí)已成為AI主流技術(shù)。這些技術(shù)的興起推動了AI的發(fā)展,但也凸顯了數(shù)據(jù)和存儲系統(tǒng)訪問中存在的一些挑戰(zhàn)。”

  “我們在1000個節(jié)點(diǎn)的集群中部署了Alluxio,用來加速我們游戲AI平臺上模型訓(xùn)練的數(shù)據(jù)預(yù)處理。事實(shí)證明Alluxio穩(wěn)定、可擴(kuò)展且易于管理。”騰訊大數(shù)據(jù)平臺研發(fā)負(fù)責(zé)人陳鵬表示。“隨著越來越多的大數(shù)據(jù)和AI應(yīng)用容器化,Alluxio正在成為大型企業(yè)和機(jī)構(gòu)的首選,作為加速數(shù)據(jù)分析和模型訓(xùn)練的中間層。”

  “擁有大規(guī)模分析和AI/ML計(jì)算框架的數(shù)據(jù)團(tuán)隊(duì)面臨著越來越大的壓力,需要讓日益增長的數(shù)據(jù)源更易于訪問,同時確保性能的穩(wěn)定,這需要同時考慮數(shù)據(jù)本地性、網(wǎng)絡(luò)I/O和成本問題,”ESG分析師 Mike Leone表示。“企業(yè)和機(jī)構(gòu)希望選用更實(shí)惠和可擴(kuò)展的存儲,如云對象存儲,同時避免昂貴的應(yīng)用程序修改或處理新的性能問題。Alluxio通過抽象存儲細(xì)節(jié)并使數(shù)據(jù)更接近計(jì)算側(cè)來應(yīng)對這些挑戰(zhàn),尤其是在混合云和多云環(huán)境中。”

  Alluxio 2.7版本新增以下功能:

  使用Alluxio和NVIDIA的DALI進(jìn)行機(jī)器學(xué)習(xí)訓(xùn)練

  NVIDIA的數(shù)據(jù)加載庫(DALI)是一個常用的Python庫,支持通過CPU和GPU進(jìn)行數(shù)據(jù)加載和預(yù)處理從而加速深度學(xué)習(xí)。在2.7版本中,Alluxio平臺進(jìn)行了優(yōu)化,可以與DALI一起部署用于加速基于Python的ML應(yīng)用,其中包括模型訓(xùn)練和推理之前的數(shù)據(jù)加載和預(yù)處理步驟。通過加速I/O密集型工作并允許并行處理后續(xù)的計(jì)算密集型訓(xùn)練,Alluxio數(shù)據(jù)平臺上的端到端訓(xùn)練與傳統(tǒng)解決方案相比實(shí)現(xiàn)了顯著的性能提升。對于海量小文件的訓(xùn)練,與其他解決方案相比,該解決方案可以實(shí)現(xiàn)橫向擴(kuò)展(scale-out)。

  大規(guī)模數(shù)據(jù)加載

  Alluxio的核心定位是數(shù)據(jù)管理能力,這些能力包括對分散的數(shù)據(jù)源進(jìn)行統(tǒng)一和實(shí)現(xiàn)緩存。隨著Alluxio越來越多地用于計(jì)算和存儲跨多個地理位置的場景,Alluxio自身也在不斷擴(kuò)展。本次更新采用新技術(shù)對數(shù)據(jù)進(jìn)行批處理,從而增強(qiáng)其可擴(kuò)展性。批處理通過使用內(nèi)置執(zhí)行引擎處理數(shù)據(jù)加載等任務(wù),減少了管理控制器對資源的需求,從而減少了系統(tǒng)配置的工作量,降低了成本。

  Kubernetes上的易用性

  Alluxio現(xiàn)在支持用于Kubernetes的原生容器存儲接口(CSI)驅(qū)動,以及用于ML的Kubernetes operator,這使得在容器化環(huán)境中的 Alluxio平臺上操作 ML工作流比以往任何時候都更加容易。 Alluxio的卷類型現(xiàn)在可用于 Kubernetes 環(huán)境。敏捷性和易用性是本次新版本關(guān)注的重點(diǎn)。

  在Presto上基于分析動態(tài)調(diào)整緩存

  新版本還推出了智能緩存新功能,名為Shadow Cache,能夠動態(tài)分析緩存大小對響應(yīng)速度的影響,從而輕松實(shí)現(xiàn)高性能和低成本之間的平衡。對于大規(guī)模的多租戶Presto環(huán)境,此新功能通過自助管理顯著降低了管理開銷。

  “在存儲與ML計(jì)算分離的情況下,數(shù)據(jù)平臺團(tuán)隊(duì)利用 Alluxio 來簡化數(shù)據(jù)預(yù)處理和加載階段,”Alluxio高級產(chǎn)品經(jīng)理 Adit Madan表示,“這種簡化使得Spark ML、Tensorflow 和 PyTorch 等框架能最大限度地利用GPU。 Alluxio 解決方案可在 AWS、GCP 和 Azure Cloud 等多個云平臺上使用,現(xiàn)在也可在私有數(shù)據(jù)中心或公有云中的 Kubernetes上使用。”

  下載

  Alluxio 2.7 版本可在此即刻下載:https://www.alluxio.io/download/

 

責(zé)任編輯:張誠 來源: Alluxio
相關(guān)推薦

2020-06-30 08:45:00

人工智能醫(yī)療技術(shù)

2013-06-17 11:53:49

思科云服務(wù)思科

2011-07-29 15:02:22

LifeSize視頻協(xié)作

2021-04-27 11:20:20

機(jī)器學(xué)習(xí)骨科醫(yī)療

2021-01-10 23:46:19

人工智能機(jī)器人科技

2021-01-11 14:07:27

人工智能生物安全智慧城市

2014-01-08 10:22:28

思科Videoscape

2011-04-01 15:10:33

Java云計(jì)算

2021-04-05 18:06:36

谷歌安卓Google Play

2019-11-21 12:56:43

EasyStack

2015-10-19 14:57:51

2011-07-27 12:58:43

Android MarAndroid應(yīng)用商店

2023-12-07 14:35:15

2021-12-27 11:03:04

人工智能機(jī)器學(xué)習(xí)技術(shù)

2009-12-13 15:23:36

2018-11-05 15:55:02

紅帽企業(yè)Linux 7.6

2014-11-07 14:48:00

文思海輝云計(jì)算

2009-02-27 08:49:30

微軟Linux侵權(quán)起訴
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號