自拍偷在线精品自拍偷,亚洲欧美中文日韩v在线观看不卡

如何借助云集群打造高性能計算

譯文
云計算
OpenStack讓企業(yè)組織可以定制自己的資源實例,然后使用這些資源實例在自己的私有云中構(gòu)建集群。物理服務(wù)器或使用物理服務(wù)器上虛擬機管理程序的虛擬機在專用的內(nèi)部部署集群中很典型。對開發(fā)人員來說,區(qū)別主要在于資源實例抽象,這是云集群與專用集群之間的主要區(qū)別。

云計算一開始致力于為互動系統(tǒng)(systems of engagement)改善應(yīng)用架構(gòu),而在高性能計算方面提供不了什么。而如今,領(lǐng)先的云服務(wù)提供商正在重構(gòu)解決方案及相關(guān)的基礎(chǔ)設(shè)施,讓計算密集型應(yīng)用切合實際、經(jīng)濟高效。

[[145847]]

在過去,云架構(gòu)是為了交付將應(yīng)用程序與Dropbox、Gmail、iTunes和Evernote等存儲結(jié)合起來的服務(wù)而設(shè)計的。Bright Computing公司的***執(zhí)行官Matthijs Van Leeuwen說:“集群的架構(gòu)旨在暴露除了存儲外的其他資源,比如在定制網(wǎng)絡(luò)中執(zhí)行廠商提供的或用戶構(gòu)建的應(yīng)用程序所需要的那些資源。”

酷似在專用硬件上運行的傳統(tǒng)集群,基于云的集群包括不同的分布式資源,這些資源因某個用途而結(jié)合起來。這可能包括:為可識別集群的數(shù)據(jù)庫管理系統(tǒng)(DBMS)、高性能計算(HPC)應(yīng)用或大數(shù)據(jù)分析應(yīng)用交付平臺。亞馬遜和Rackspace之類的公有云提供商暴露資源的預(yù)定義實例,它們可以用于在云基礎(chǔ)設(shè)施上構(gòu)建集群。

OpenStack讓企業(yè)組織可以定制自己的資源實例,然后使用這些資源實例在自己的私有云中構(gòu)建集群。物理服務(wù)器或使用物理服務(wù)器上虛擬機管理程序的虛擬機在專用的內(nèi)部部署集群中很典型。對開發(fā)人員來說,區(qū)別主要在于資源實例抽象,這是云集群與專用集群之間的主要區(qū)別。

常見的集群使用場合

Leeuwen表示,云集群可以用來取代或補充專用資源。對于運行在低配專用硬件(比如筆記本電腦)上的應(yīng)用程序而言,云可以用來為集群創(chuàng)建實例、使用集群以及刪除實例。在這種使用場合下,筆記本電腦只是訪問基于云的集群的最終用戶設(shè)備而已。它并不提供用來執(zhí)行計算或設(shè)計網(wǎng)絡(luò)的任何實例化資源。

在第二種常見的使用場合下,基于云的資源可以用來補充專用資源。這種情況下,內(nèi)部部署的資源通過云突發(fā)流程,由云端可用的那些資源予以拓展?;谠频馁Y源只要根據(jù)需要創(chuàng)建實例、使用并刪除實例。可以做到內(nèi)部部署資源與云端資源的這種區(qū)別對最終用戶和許多類型的應(yīng)用而言是透明的。

這兩種使用場合都可以運用到公有云或私有云。企業(yè)組織可以設(shè)計其應(yīng)用程序架構(gòu),以便直接做到這一點,或者充分利用Bright Cluster Manager之類的工具,在AWS公有云或在OpenStack私有云中構(gòu)建集群,前期的開發(fā)和配置工作比較少。

彌補抽象方面的缺口

開發(fā)人員面臨的***挑戰(zhàn)就是,用于相對專用硬件,配置云資源(比如網(wǎng)絡(luò)、處理器和存儲)的不同抽象模式。云依賴實例化資源。除了存儲外,暴露基于云的處理器實例在公有云和私有云解決方案中都相當(dāng)成熟。***的云解決方案隨帶服務(wù)和鉤子(hook),可用于指定異常需求,比如InfiniBand網(wǎng)絡(luò)連接、GPU加速和定制的IP網(wǎng)絡(luò)。

任何資源都需要通過這同一條路徑來傳輸,之后才能予以暴露,以便在任何一種類型的云里面利用。由于集群通常使用低延遲高帶寬的互連結(jié)構(gòu)、加速器和協(xié)處理器以及其他的專門資源,這每一個在基于云的集群方面同時帶來了機遇和挑戰(zhàn)。

Leeuwen表示,企業(yè)組織完全由云服務(wù)提供商來支持存儲和計算之外的資源實例化。比如說,AWS通過亞馬遜VPC以及英偉達GPU實例,支持定制的IP網(wǎng)絡(luò)。一種良好的做法就是,開發(fā)標(biāo)準(zhǔn)的配置,或者充分利用第三方云管理工具,管理存儲、計算、網(wǎng)絡(luò)和加速器等資源,無論它們駐留在企業(yè)內(nèi)部,還是與AWS協(xié)同使用。

延遲對集群來說很關(guān)鍵

通信延遲是構(gòu)建可擴展集群應(yīng)用面臨的***挑戰(zhàn)之一。一個良好的做法就是,為HPC智能化緩存數(shù)據(jù)。在數(shù)據(jù)方面,這需要認(rèn)真考慮使用更具成本效益的、速度較慢的持久性存儲服務(wù)(比如AWS S3)和歸檔服務(wù)(比如AWS Glacier),而不是成本較為高昂的RAM實例。

但是一個還要重大的網(wǎng)絡(luò)挑戰(zhàn)在于在運算期間,盡量縮短節(jié)點之間的通信延遲。處理期間充分利用消息傳遞的HPC應(yīng)用最有可能出現(xiàn)瓶頸。大量使用消息傳遞接口(MPI)等接口的應(yīng)用會陷入困境,除非開發(fā)人員和操作團隊確保節(jié)點之間的延遲極低。

如果MPI應(yīng)用在密封在私有云或公有云里面的集群中運行,這個問題比較容易解決。但如果在不同公有云或私有云基礎(chǔ)設(shè)施上運行的不同節(jié)點之間有大量的MPI流量,這個問題就比較棘手。

這些考慮同樣適用于云端運行大數(shù)據(jù)分析任務(wù)。讓Hadoop分布式文件系統(tǒng)(HDFS)實例橫跨內(nèi)部部署基礎(chǔ)設(shè)施和云基礎(chǔ)設(shè)施沒有太大意義。Leeuwen說:“但是完全在內(nèi)部或完全在云端的HDFS實例實際上能取得相當(dāng)好的效果。”

敏捷云整合解決方案提供商Jitterbit的***技術(shù)官Ilan Sehayek表示,你在擴展時要保持性能的關(guān)鍵在于分布式架構(gòu)。“讓用戶自行選擇哪里運行API,哪里運行支持API的服務(wù)。”

另外要確保所有通信由可擴展的消息傳遞基礎(chǔ)設(shè)施來支持,以便快速、有保障地處理API網(wǎng)關(guān)與服務(wù)之間的API請求。Sehayek補充說,面向集群的服務(wù)還需要高效的緩存技術(shù),以便提供快速響應(yīng)API這一機制。

原文標(biāo)題:High-performance computing with cloud clusters

責(zé)任編輯:Ophira 來源: 51CTO
相關(guān)推薦

2015-05-25 10:16:33

云集群高性能計算OpenStack

2015-06-01 07:02:12

云集群高性能計算

2017-09-18 01:21:05

美團IDC集群銳捷網(wǎng)絡(luò)

2023-02-21 14:16:42

2015-09-16 13:23:08

閱兵藍(lán)曙光高性能計算

2009-06-26 04:30:15

曙光高性能管理

2011-07-01 09:36:30

高性能Web

2015-09-23 09:40:17

高性能Java應(yīng)用

2011-10-21 14:20:59

高性能計算HPC虛擬化

2011-10-25 13:13:35

HPC高性能計算Platform

2012-01-16 09:00:18

云計算高性能計算

2011-11-04 10:24:09

AMDFusion APU高性能計算

2015-11-18 17:32:36

英特爾

2024-04-25 10:09:02

2019-03-01 11:03:22

Lustre高性能計算

2015-11-23 09:38:03

2009-11-20 17:11:51

寬帶路由防火墻

2019-09-11 09:30:44

2018-09-28 04:46:19

負(fù)載均衡JavaLVS

2018-01-11 13:23:22

華為云
點贊
收藏

51CTO技術(shù)棧公眾號